AI分野論文まとめ【2020年02月25日arXiv公開】

アブストまとめ
Like0
お気に入り

2020年02月25日に発表されたAI分野の論文42本のAbstractをまとめて和訳しました。

この記事の見出し

LogicGAN: Logic-guided Generative Adversarial Networks

LogicGAN:論理誘導型の生成的敵対ネットワーク

著者:Laura Graves, Vineel Nagisetty, Joseph Scott, Vijay Ganesh
URL:http://arxiv.org/abs/2002.10438v1

この論文の概要(機械翻訳による和訳)
Generative Adversarial Networks(GAN)は、DeepNeural Networks(DNN)の革新的なクラスであり、現実的な画像、音楽、テキスト、その他のデータの生成に使用されています。ただし、GANトレーニングはリソースを集中的に使用することで有名であり、多くの課題を抱えていることはよく知られています。生成された例)。対照的に、LogicGANと呼ばれる新しいクラスのGANを提案します。これは、(ロジックベースの)説明可能なAI(xAI)システムの最近の進歩を活用して、識別器からジェネレーターへの「より豊かな」修正フィードバックを提供します。具体的には、弁別者が分類を行った理由を特定するxAIシステムを使用して勾配降下プロセスを修正し、それにより、ジェネレータが弁別者をよりよく欺くのに役立つより豊富な修正フィードバックを提供します。このアプローチを使用して、LogicGANはonMNISTデータをはるかに高速に学習し、Fr ‘echet Inception Distanceで測定されたものと同じ品質を維持しながら、標準GANよりもシングルクラスで45%、マルチクラス設定で12.73%のデータ効率の改善を達成することを示します。さらに、LogicGANを使用すると、ユーザーは標準のGANsystemsよりもモデルの学習方法をより詳細に制御できます。

From Chess and Atari to StarCraft and Beyond: How Game AI is Driving the World of AI

Chess and AtariからStarCraft and Beyond:ゲームAIがAIの世界をどのように推進しているか

著者:Sebastian Risi, Mike Preuss
URL:http://arxiv.org/abs/2002.10433v1

この論文の概要(機械翻訳による和訳)
このペーパーでは、特定のゲームをプレイできるエージェントの作成だけでなく、ゲームコンテンツの自動作成、ゲーム分析、プレーヤーモデリングなど、さまざまな分野を扱うGame AIの分野についても説明します。 Game AIは長い間、より大きな科学コミュニティによってあまり認識されていませんでしたが、StarCraft 2やQuake IIIなどのビデオゲームのマスタリングの進歩をカバーするAIアルゴリズムと記事の最も高度な形式を開発およびテストするための研究分野としての地位を確立しています最も有名な雑誌。フィールドの成長のため、1回のレビューで完全にカバーすることはできません。そのため、ゲームAIの進歩は、ロボット工学や化学物質の合成など、ゲーム以外の分野にも拡大し始めているなど、最近の重要な開発に重点を置いています。この記事では、これらのブレークスルーへの道を開いたアルゴリズムと方法を確認し、ゲームAIの研究の他の重要な領域について報告し、また、ゲームAIの将来の刺激的な方向性を指摘します。

Clustering and Classification with Non-Existence Attributes: A Sentenced Discrepancy Measure Based Technique

存在しない属性によるクラスタリングと分類:高度な不一致測定ベースの手法

著者:Y. A. Joarder, Emran Hossain, Al Faisal Mahmud
URL:http://arxiv.org/abs/2002.10411v1

この論文の概要(機械翻訳による和訳)
データインスタンスの一部またはすべてについて、独立した世界のクラスタリングの問題の多くは、属性の消失や欠落のためにデータの特性評価が不完全であるという問題があります。典型的なクラスタリング手法は、代入または辺縁化などの手法による前処理を行わない限り、そのようなデータに直接適用できません。この欠点は、属性重み付けペナルティに基づくDiscrepancy(AWPD)と呼ばれるSentencedDiscrepancy Measureを利用することで克服しました。 AWPDメジャーを使用して、クラスタリングアルゴリズム用にK-MEANS ++およびスケーラブルK-MEANS ++を、分類用にk Nearest Neighbor(kNN)を変更して、存在しない属性を持つデータセットに直接適用できるようにしました。新しいAWPDベースのK-MEANS ++、スケーラブルK-MEANS ++、およびkNNalgorithmが反復回数の中でローカルプライムにマージされることを示す詳細な理論分析を示しました。さまざまな形態の非存在の多数のベンチマークデータセットに関する詳細な実験を報告しており、投影されたクラスタリングおよび分類手法は、通常、このような不十分なデータを処理するために一般的に使用されるいくつかの有名な補完方法と比較して、より良い結果を示すことを示しています。貴重なデータ:存在しない属性を持つデータセットにメソッドを直接適用し、最高の精度と最小コストで非構造化された存在しない属性を検出する方法を確立します。

Lagrangian Decomposition for Neural Network Verification

ニューラルネットワーク検証のためのラグランジアン分解

著者:Rudy Bunel, Alessandro De Palma, Alban Desmaison, Krishnamurthy Dvijotham, Pushmeet Kohli, Philip H. S. Torr, M. Pawan Kumar
URL:http://arxiv.org/abs/2002.10410v1

この論文の概要(機械翻訳による和訳)
ニューラルネットワーク検証の基本的なコンポーネントは、出力が取りうる値の境界の計算です。以前の方法では、既成のソルバーを使用して問題の構造を破棄するか、問題をさらに緩和して境界を不必要に緩めていました。ラグランジアン分解に基づく新しいアプローチを提案します。私たちの定式化は、効率的な超勾配上昇アルゴリズムと改良された近位アルゴリズムを認めています。両方のアルゴリズムには、次の3つの利点があります。(i)ラグランジュ緩和に依存する以前のデュアルアルゴリズムと少なくとも同じくらい厳密に証明される範囲を生成します。 (ii)ニューラルネットワークレイヤーのフォワード/バックワードパスに類似した操作に基づいているため、簡単に並列化でき、GPU実装に対応し、問題の畳み込み構造を活用できます。 (iii)有効な境界を提供しながら、いつでも停止できます。経験的に、実行時間のほんの一部で既製のソルバーと同等の境界を取得し、以前のデュアルアルゴリズムと同じ時間でより厳密な境界を取得することを示します。これにより、正式な検証に境界を使用する場合の全体的な速度が向上します。

Symbolic Learning and Reasoning with Noisy Data for Probabilistic Anchoring

確率的アンカーリングのためのノイズのあるデータによる記号学習と推論

著者:Pedro Zuidberg Dos Martires, Nitesh Kumar, Andreas Persson, Amy Loutfi, Luc De Raedt
URL:http://arxiv.org/abs/2002.10373v1

この論文の概要(機械翻訳による和訳)
ロボットエージェントは、サブシンボリックセンサーデータから学習できると同時に、オブジェクトについて推論し、非シンボリックレベルで人間と通信できる必要があります。これは、シンボリック人工知能とサブシンボリック人工知能の間のギャップをどのように克服するかという問題を提起します。私たちは、世界のオブジェクト中心表現を使用したボトムアップオブジェクトアンカーリングに基づくセマンティックワールドモデリングアプローチを提案します。知覚的アンカーは、連続的な知覚センサーデータを処理し、シンボリック表現への対応を維持します。マルチモーダル確率分布を処理するためにアンカーの定義を拡張し、結果のシンボルアンカーシステムを推論を実行するための確率的論理推論システムに結合します。さらに、統計的関係学習を使用して、固定フレームワークが、ノイズの多いサブシンボリックセンサー入力からtheworldの確率論的論理ルールのセットの形でシンボリック知識を学習できるようにします。結果として得られるフレームワークは、知覚的アンカーリングと統計的関係学習を組み合わせて、感覚入力を介して直接観察されないオブジェクトの状態についての論理的表現の表現力を活用しながら、時間の経過とともに知覚されたすべてのオブジェクトの意味世界モデルを維持することができますデータ。アプローチを検証するために、一方では、マルチモーダル確率分布に対して確率論的推論を実行するシステムの能力を実証し、他方では、知覚的観察によって生成された固定オブジェクトからの確率論的ルールの学習を実証します。学習された論理ルールは、その後、提案された確率的アンカー手順を評価するために使用されます。オブジェクトのオクルージョンが発生し、オブジェクトを正しく固定するために確率的推論が必要なオブジェクトの相互作用を含む設定でシステムを実証します。

The Early Phase of Neural Network Training

ニューラルネットワークトレーニングの初期段階

著者:Jonathan Frankle, David J. Schwab, Ari S. Morcos
URL:http://arxiv.org/abs/2002.10365v1

この論文の概要(機械翻訳による和訳)
最近の研究では、ニューラルネットワーク学習の多くの重要な側面が、トレーニングの非常に初期の反復またはエポック内で行われていることが示されています。 Gur-Ari et al。、2018)、およびネットワークは重要な期間を経ています(Achille et al。、2019)。ここでは、この初期段階のトレーニング中にディープニューラルネットワークが受ける変化を調べます。トレーニングの初期の反復中にネットワーク状態の広範な測定を実行し、Frankle et al。(2019)のフレームワークを活用して、データセットのさまざまな側面の重み分布とその依存性を定量的にプローブします。このフレームワーク内では、ディープネットワークは、符号を維持しながらランダムな重みで再初期化することに対してロバストではなく、わずか数百回の反復後でも重み分布は非常に非依存であることがわかります。この振る舞いにもかかわらず、ぼやけた入力または補助的な自己監視タスクによる事前トレーニングは、監視ネットワークの変化を近似することができ、これらの変化は本質的にラベル依存ではないことを示唆しますが、ラベルはこのプロセスを大幅に加速します。一緒に、これらの結果は、この重要な初期学習期間中に発生するネットワークの変化を解明するのに役立ちます。

KBSET — Knowledge-Based Support for Scholarly Editing and Text Processing with Declarative LaTeX Markup and a Core Written in SWI-Prolog

KBSET-宣言型LaTeXマークアップとSWI-Prologで記述されたコアを使用した学術編集とテキスト処理の知識ベースのサポート

著者:Jana Kittelmann, Christoph Wernhard
URL:http://arxiv.org/abs/2002.10329v1

この論文の概要(機械翻訳による和訳)
KBSETは、2つのフレーバーで学術編集をサポートする環境です。1つ目は、ソース文書からPDFおよびHTMLプレゼンテーションまで、完全に通信のエディション(特に18世紀および19世紀)の開発に伴う実用的なツールKBSET /レターです。 、自動化された名前付きエンティティ認識を中心とするエディションで作業する小説形式を実験的に調査するためのプロトタイプツールKBSET / NERとして。 KBSETは、LaTeX表記で表現されるアプリケーション固有の宣言型マークアップを処理し、RDFで通常提供される大規模な外部ファクトベースを組み込むことができます。 KBSETには、特別に開発されたLaTeXスタイルと、SWI-Prologで記述されたコアシステムが含まれています。

Learning Certified Individually Fair Representations

認定された個人的に公正な表現の学習

著者:Anian Ruoss, Mislav Balunović, Marc Fischer, Martin Vechev
URL:http://arxiv.org/abs/2002.10312v1

この論文の概要(機械翻訳による和訳)
公平性の制約を効果的に実施するには、適切な公平性の概念を定義し、データ消費者のダウンストリームユーティリティを損なうことなくこの概念を課すために表現学習を採用する必要があります。望ましい概念は、同様の個人に対する同様の待遇を保証する個人の公平性です。この作業では、論理的制約を介して個人の公平性を豊富な類似性概念に一般化し、データ消費者がモデルの公平性証明書を取得できるようにする最初の方法を紹介します。重要な考え方は、類似した個人を最大で$ epsilon $離れた潜在的表現に証明できる表現を学習することです。分類子。 6つの実世界のデータセットと広範な公平性制約に関する実験的評価は、このアプローチが、現実的なユースケースにスケーリングしながら既存の距離メトリックを超える類似性の概念をキャプチャするのに十分に表現力があることを示しています。

Adaptive Propagation Graph Convolutional Network

適応伝播グラフ畳み込みネットワーク

著者:Indro Spinelli, Simone Scardapane, Aurelio Uncini
URL:http://arxiv.org/abs/2002.10306v1

この論文の概要(機械翻訳による和訳)
グラフ畳み込みネットワーク(GCN)は、頂点単位の操作とノード間のメッセージ受け渡し交換をインターリーブすることにより、グラフデータの推論を実行するニューラルネットワークモデルのファミリーです。後者に関しては、2つの重要な疑問が生じます。(i)微分可能な交換プロトコル(たとえば、元のGCNのa1ホップラプラシアン平滑化)の設計方法、および(ii)ローカル更新に関する複雑さのトレードオフの特性評価方法。この論文では、各ノードで独立して通信ステップの数を調整することにより、最先端の結果を達成できることを示します。特に、各ノードに停止ユニット(Gravesの適応計算時間に触発された)を付与します。その後、すべての交換が通信を継続するかどうかを決定します。提案された適応伝播GCN(AP-GCN)は、追加パラメーターの点でわずかなオーバーヘッドを必要とする一方で、これまでにいくつかのベンチマークで最良の提案モデルに対して優れたまたは類似の結果を達成することを示します。また、コミュニケーションと正確性の間の明示的なトレードオフを実施するために、正規化用語を調査します。 AP-GCN実験のコードは、オープンソースライブラリとしてリリースされています。

SupRB: A Supervised Rule-based Learning System for Continuous Problems

SupRB:連続問題のための教師ありルールベースの学習システム

著者:Michael Heider, David Pätzel, Jörg Hähner
URL:http://arxiv.org/abs/2002.10295v1

この論文の概要(機械翻訳による和訳)
SupRB学習システム、多次元連続決定問題に関する教師あり学習のための新しいピッツバーグスタイル学習分類システム(LCS)を提案します。 SupRBは、例(状況、選択、および関連する品質で構成される)から品質関数の近似値を学習し、最適な選択を行い、特定の状況での選択の品質を予測することができます。 SupRBの適用分野の1つは、産業機械のパラメーター化です。この分野では、機械学習システムの推奨事項の受け入れは、オペレーターの信頼に大きく依存しています。その信頼のための本質的で研究されている成分は予測品質ですが、これだけでは十分ではないようです。少なくとも重要なのは、推奨の背後にある理由の人間が理解できる説明です。人工ニューラルネットワークなどの多くの最先端の方法ではこれに達しませんが、SupRBなどのLCSは、非常に簡単に理解できる人間が読めるルールを提供します。普及しているLCSは、継続的な選択をサポートしていないため、この問題に直接適用できません。このホワイトペーパーでは、SupRBの基礎を築き、積層造形問題の単純化モデルでの一般的な適用性を示します。

The Knowledge Graph Track at OAEI — Gold Standards, Baselines, and the Golden Hammer Bias

OAEIのナレッジグラフトラック-ゴールドスタンダード、ベースライン、ゴールデンハンマーバイアス

著者:Sven Hertling, Heiko Paulheim
URL:http://arxiv.org/abs/2002.10283v1

この論文の概要(機械翻訳による和訳)
オントロジーアライメント評価イニシアチブ(OAEI)は、オントロジーマッチングツールの年次評価です。 2018年に、ナレッジグラフトラックを開始しました。その目標は、大規模ナレッジグラフのエンティティとスキーマの同時マッチングを評価することです。このペーパーでは、トラックの設計と、ゴールドスタンダード作成の2つの異なる戦略について説明します。トラックの初版で得られた結果と経験を分析し、隠されたタスクを明らかにすることにより、トラック(およびおそらく他のトラックにも)提出されたすべてのツールが、ゴールデンハンマーバイアスと呼ばれるバイアスの影響を受けることを示します。

Learning from Positive and Unlabeled Data with Arbitrary Positive Shift

任意のポジティブシフトによるポジティブおよびラベルなしデータからの学習

著者:Zayd Hammoudeh, Daniel Lowd
URL:http://arxiv.org/abs/2002.10261v1

この論文の概要(機械翻訳による和訳)
正のラベルなし(PU)学習では、正のラベルなしデータのみを使用してバイナリ分類器をトレーニングします。一般的な単純化の仮定は、陽性データが標的陽性クラスを代表しているというものです。この仮定は、時間変動、ドメインシフト、または敵対的な概念のドリフトにより、実際にはしばしば違反されます。この論文は、ソースおよびターゲットの分布からラベルのないデータセットが提供された場合、任意の非代表的なポジティブデータでもPU学習が可能であることを示しています。重要な洞察は、負のクラスの分布のみを修正する必要があるということです。このような任意の正のバイアスの下で学習する2つの方法を提案します。前者は負のラベルなし(NU)学習とラベルなし-ラベルなし(UU)学習を組み合わせ、他方はポジティブシフトにロバストな新規再帰リスク推定器を使用します。実験結果は、多数の実世界のデータセットおよび正のデータバイアスの形式全体でのメソッドの有効性を実証します。

Markov Logic Networks with Complex Weights: Expressivity, Liftability and Fourier Transforms

複雑な重みを持つマルコフ論理ネットワーク:表現力、リフト可能性、フーリエ変換

著者:Ondrej Kuzelka
URL:http://arxiv.org/abs/2002.10259v1

この論文の概要(機械翻訳による和訳)
マルコフ論理ネットワーク(MLN)の表現力を研究します。複素数値の重みを使用するcomplexMLNを導入し、実数値の重みを持つ標準MLNとは異なり、複雑なMLNが完全に表現力があることを示します。次に、複雑な重みを持つ加重一次モデルカウント(WFOMC)を使用して離散フーリエ変換を計算できることを観察し、この観測を使用して、最近のアルゴリズムよりも実質的に少ないWFOMCオラクルへの呼び出しを必要とするリレーショナルマージナルポリトープを計算するアルゴリズムを設計します。

FR-Train: A mutual information-based approach to fair and robust training

FR-Train:公正かつ堅牢なトレーニングへの相互情報ベースのアプローチ

著者:Yuji Roh, Kangwook Lee, Steven Euijong Whang, Changho Suh
URL:http://arxiv.org/abs/2002.10234v1

この論文の概要(機械翻訳による和訳)
信頼できるAIは、正確なモデルのトレーニングに加えて、データバイアスとポイズニングが存在する場合の公正かつ堅牢なトレーニングの両方を考慮する必要がある機械学習の重要な問題です。ただし、既存のモデルの公平性手法では、誤ってポイズニングされたデータを追加のバイアスと見なし、パフォーマンスが大幅に低下します。この問題を解決するために、公正かつ堅牢なモデルトレーニングを全体的に実行するFRトレインを提案します。既存の敵対訓練ベースの公正さのみの方法の相互情報ベースの解釈を提供し、この考え方を、クリーン検証セットを使用して汚染データを識別し、その影響を減らすことができる追加の識別器を設計するために適用します。私たちの実験では、FR-Trainは、偏りの緩和と中毒に対する防御の両方によって、データ中毒の存在下で公平性と精度の低下をほとんど示しません。また、クラウドソーシングを使用してクリーンな検証セットを構築する方法を示し、新しいベンチマークデータセットをリリースします。

Injective Domain Knowledge in Neural Networks for Transprecision Computing

超精密計算のためのニューラルネットワークにおける単射領域知識

著者:Andrea Borghesi, Federico Baldo, Michele Lombardi, Michela Milano
URL:http://arxiv.org/abs/2002.10214v1

この論文の概要(機械翻訳による和訳)
機械学習(ML)モデルは、大きなデータセットから意味のある情報を抽出する機能があるため、多くの学習タスクで非常に効果的ですが、純粋なデータに依存して簡単に解決できない学習問題があります。不足しているデータまたは近似する非常に複雑な関数。幸いなことに、多くのコンテキストでドメイン知識が明示的に利用可能であり、より良いMLモデルを訓練するために使用できます。このホワイトペーパーでは、重要な学習タスク、つまり超精密コンピューティングアプリケーションの精密調整を扱う際に、事前の知識を統合することで得られる改善点について検討します。ドメイン情報は、異なる方法でMLモデルに注入されます。I)追加機能、II)アドホックグラフベースのネットワークトポロジ、III)正規化スキーム。結果は、問題固有の情報を活用するMLモデルが純粋にデータ駆動型のものよりも優れており、平均精度が約38%向上していることを明確に示しています。

When Relation Networks meet GANs: Relation GANs with Triplet Loss

関係ネットワークがGANに会うとき:三重項損失を伴う関係GAN

著者:Runmin Wu, Kunyao Zhang, Lijun Wang, Yue Wang, Huchuan Lu, Yizhou Yu
URL:http://arxiv.org/abs/2002.10174v1

この論文の概要(機械翻訳による和訳)
最近の研究では、生成的敵対ネットワーク(GAN)を使用してリアルな画像を生成することで著しい進歩を遂げていますが、トレーニングの安定性の欠如は、特に高解像度の入力や複雑なデータセットの場合、ほとんどのGANの長引く懸念事項です。ランダムに生成された分布は実際の分布とほとんど重複しないため、GANのトレーニングでは勾配消失の問題がしばしば発生します。重みクリッピング、勾配ペナルティ、スペクトル正規化などの経験的手法を使用して弁別器の機能を制限することにより、この問題に対処するためのいくつかのアプローチが提案されています。実際の入力サンプルと偽の入力サンプルを区別するために弁別器をトレーニングする代わりに、同じ分布からのペアのサンプルと異なる分布からのサンプルを分離するために弁別器をトレーニングすることにより、ペアのサンプル間の関係を調査します。この目的のために、識別器の関係ネットワークアーキテクチャを検討し、より良い一般化と安定性を実行するatriplet損失を設計します。ベンチマークデータセットに関する広範な実験により、提案された関係判別子と新しい損失により、無条件および条件付きの画像生成や画像変換などの可変視力タスクの大幅な改善が得られることが示されています。 / Relation-GAN}

Optimal strategies in the Fighting Fantasy gaming system: influencing stochastic dynamics by gambling with limited resource

Fighting Fantasyゲームシステムの最適戦略:限られたリソースでのギャンブルによる確率的ダイナミクスへの影響

著者:Iain G. Johnston
URL:http://arxiv.org/abs/2002.10172v1

この論文の概要(機械翻訳による和訳)
ファイティングファンタジーは世界中で人気のあるレクリエーションファンタジーゲームシステムです。このシステムでの戦闘は、それぞれが勝ち負けする可能性のある一連のラウンドを含む確率的ゲームで進行します。各ラウンドでは、限られたリソース(「幸運」)がギャンブルに費やされ、勝ちの利益を増幅したり、損失による赤字を緩和したりすることがあります。ただし、このギャンブルの成功は残りのリソースの量に依存し、ギャンブルが失敗した場合、利益は減少し、赤字は増加します。したがって、プレーヤーはリソースを動的に選択して、ゲームの確率的ダイナミクスに影響を与えようとし、肯定的なリターンの可能性を減らします。勝利のための最適戦略の特定は、まだ解決されていないマルコフ決定問題です。ここでは、確率的分析とシミュレーションを動的プログラミングと組み合わせて、ギャンブル政策の不在と存在下でのシステムの動的挙動を特徴付けます。運に基づく戦略を使用せずに、勝利確率の簡単な式を導き出します。システムのベルマン方程式を解き、ゲーム中の特定の状態に最適な戦略を特定するために、後方誘導アプローチを使用します。最適な制御戦略は成功の確率を劇的に高めることができますが、詳細な形を取ります。確率的シミュレーションを使用して、これらの最適な戦略を、実際に使用できる単純なヒューリスティックで近似します。私たちの調査結果は、世界中の何百万人もの人々がプレイするゲームの成功を改善するためのロードマップを提供し、確率論的ゲームの収益の減少を伴うリソース割り当ての問題のクラスを通知します。

Cognitive Argumentation and the Suppression Task

認知的議論と抑制タスク

著者:Emmanuelle-Anna Dietz Saldanha, Antonis Kakas
URL:http://arxiv.org/abs/2002.10149v1

この論文の概要(機械翻訳による和訳)
この論文は、認知的議論と呼ばれる新しいフレームワーク内で、人間の推論のモデリングの課題に対処します。このフレームワークは、人間の論理的推論は本質的に弁証法のプロセスであるという仮定に基づいており、計算的で実行可能な人間の推論の認知モデルを開発することを目的としています。論理的推論に人間の認知形態を与えるために、フレームワークは認知科学の経験的および理論的作業に基づく認知原理に依存し、AIからの計算論証の一般的および抽象的フレームワークを適切に適合させます。 CognitiveArgumentationのアプローチは、バーンの抑制タスクに関して評価されます。この目的は、異なるグループの人々の間で抑制効果を捕捉するだけでなく、各グループ内の推論の変動を説明することでもあります。参加者の反応を説明する推論:(i)十分かつ/または必要な条件内の条件の解釈、および(ii)予測的または説明的としての推論のモード。明確な結論ともっともらしい結論との自然な区別を可能にする条件付き推論。コンテキスト依存の正当な推論の重要な特性を示します。

Safe reinforcement learning for probabilistic reachability and safety specifications: A Lyapunov-based approach

確率的到達可能性と安全性仕様のための安全な強化学習:リアプノフベースのアプローチ

著者:Subin Huh, Insoon Yang
URL:http://arxiv.org/abs/2002.10126v1

この論文の概要(機械翻訳による和訳)
自動運転やロボット手術などのロボット工学や自律システムの新しいアプリケーションには、システムモデルに関する情報が限られている場合でも満たす必要がある重要な安全上の制約が含まれることがよくあります。これに関連して、確率的到達可能性分析と安全強化学習(RL)を慎重に組み合わせることにより、安全な操作の最大確率を学習するモデルフリーの安全性仕様方法を提案します。私たちのアプローチは、各ポリシーの改善段階を制限する安全なポリシーに関してリアプノフ機能を構築します。その結果、安全セットと呼ばれる安全な操作の範囲を決定する一連の安全なポリシーが生成され、単調に拡大し、徐々に収束します。また、未検査の州の安全性を特定するプロセスを加速する効率的な安全な探査スキームを開発します。リアプノフのシールドを活用して、私たちの方法は、探索ポリシーを規制して、危険な状態を高い信頼で回避します。高次元システムを扱うために、ラグランジュ緩和法を導入して、扱いやすいアクタークリティカルアルゴリズムを確立することにより、深層RLへのアプローチをさらに拡張します。私たちの方法の経験的性能は、無地のロボットアームでのリーチングタスクなどの連続制御ベンチマークの問題を通じて実証されています。

Predicting Subjective Features from Questions on QA Websites using BERT

BERTを使用してQA Webサイトの質問から主観的特徴を予測する

著者:Issa Annamoradnejad, Mohammadamin Fazli, Jafar Habibi
URL:http://arxiv.org/abs/2002.10107v1

この論文の概要(機械翻訳による和訳)
StackOverflowやQuoraなどの最新の質問応答Webサイトには、コンテンツの品質を維持するための特定のユーザールールがあります。これらのシステムは、新しいコンテンツにアクセスするためのユーザーレポートに依存していますが、これには違反の処理が遅い、通常のユーザーと経験のあるユーザーの時間が失われる、一部のレポートの品質が低い、新規ユーザーへのフィードバックが抑制されるなどの深刻な問題があります。 Q&A Webサイトでモデレーションアクションを自動化するソリューションを提供することで、QA Webサイトの質問の質や主観的な側面を予測するモデルを提供することを目指しています。このため、2019年にGoogle ResearchでCrowdSourceチームが収集したデータと、問題について事前調整されたBERTモデルを微調整しました。モデルは2エポックのトレーニング後に95.4%の精度を達成し、次のトレーニングでは大幅に改善しませんでした。結果は、簡単な微調整により、正確なモデルを短時間で、より少ないデータ量で実現できることを確認しています。

Towards precise causal effect estimation from data with hidden variables

隠れ変数を持つデータからの正確な因果効果推定に向けて

著者:Debo Cheng, Jiuyong Li, Lin Liu, Kui Yu, Thuc Duy Lee, Jixue Liu
URL:http://arxiv.org/abs/2002.10091v1

この論文の概要(機械翻訳による和訳)
観測データからの因果効果の推定は重要ですが、挑戦的なタスクです。現在、限られた数のデータ駆動型因果効果推定方法のみが利用可能です。これらの方法は、結果に対する治療の因果効果の限定的な推定を提供するか、因果効果の独自の推定を提供するものの、データまたは低効率に関する非実用的な仮定を持っています。本論文では、実用的な問題設定を特定し、この設定の下で隠された変数を持つデータから独自の因果効果推定を達成するアプローチを提案します。このアプローチでは、複雑な調整のための適切な共変量セット(調整セット)の発見をサポートするために定理を開発します。定理に基づいて、2つのアルゴリズムが隠された変数を持つデータから適切な調整セットを見つけて、偏りのない一意の因果効果推定を得るために提示されます。ベンチマークベイジアンネットワークと実世界のデータセットを使用した実験により、提案されたアルゴリズムの効率と有効性が実証され、特定された問題設定の実用性と実世界のアプリケーションでのアプローチの可能性が示されました。

Learning From Strategic Agents: Accuracy, Improvement, and Causality

戦略的エージェントからの学習:精度、改善、因果関係

著者:Yonadav Shavit, Benjamin Edelman, Brian Axelrod
URL:http://arxiv.org/abs/2002.10066v1

この論文の概要(機械翻訳による和訳)
クレジットスコアリングやアカデミックテストなど、多くの予測的意思決定シナリオでは、意思決定者は、より良い意思決定を受け取るために、エージェントの機能を「ゲーム」するインセンティブを説明するモデル(何らかの結果を予測)を構築する必要があります。戦略的分類の文献では、一般的にエージェントの結果はその機能に因果的に依存していないと想定しています(したがって、戦略的行動は嘘の形です)が、エージェントの結果を変更可能な属性の関数としてモデリングする際に並行作業に参加します。重大な現象を取り入れます:観察可能な機能を変更するためにエージェントが行動するとき、彼らは副作用として彼らの本当の結果に因果的に影響する隠された機能を混乱させるかもしれません。意思決定者のモデルには、エージェントのゲーム後の結果を正確に予測する(精度)、これらの結果を改善するためのインセンティブエージェント(改善)、および線形設定で真の因果モデルの可視係数を推定する(因果精度)。主な貢献として、エージェントの可能なアクションを事前に知らなくても、データから直接、線形最適化モデルを精度最適化、改善最適化、および因果精度最適化を学習するための最初のアルゴリズムを提供します。これらのアルゴリズムは、ミラーらの硬度結果を回避します。 (2019)意思決定者が一連の意思決定ルールに対するエージェントの反応を観察できるようにすることにより、エージェントが無料で因果介入を実行できるようにします。

Rethinking 1D-CNN for Time Series Classification: A Stronger Baseline

時系列分類のための1D-CNNの再考:より強力なベースライン

著者:Wensi Tang, Guodong Long, Lu Liu, Tianyi Zhou, Jing Jiang, Michael Blumenstein
URL:http://arxiv.org/abs/2002.10061v1

この論文の概要(機械翻訳による和訳)
1D-CNNを使用した時系列分類タスクでは、モデルが長い時系列から適切なscalesalient信号をキャプチャできるようにするために、カーネルサイズの選択が非常に重要です。 1D-CNNに関する既存の作業のほとんどは、カーネルサイズをハイパーパラメーターとして扱い、時間と効率が悪いグリッド検索を介して適切なカーネルサイズを見つけようとします。本稿では、カーネルサイズが1D-CNNのパフォーマンスにどのように影響するかを理論的に分析します。カーネルサイズ設定用の特定の設計が開発されており、非常に少数のカーネルサイズオプションを集めて、より受容的なフィールドを表すことができます。提案されたOS-CNNメソッドは、85個のデータセットを持つUCRアーカイブを使用して評価されます。実験結果は、重要な差異図、勝ち数、平均精度など、複数のパフォーマンスインジケータにおいて、この方法がより強力なベースラインであることを示しています。また、GitHub(https://github.com/Wensi-Tang/OS-CNN/)で実験的なソースコードを公開しました。

Predicting Rate of Cognitive Decline at Baseline Using a Deep Neural Network with Multidata Analysis

マルチデータ分析を備えたディープニューラルネットワークを使用したベースラインでの認知機能低下率の予測

著者:Sema Candemir, Xuan V. Nguyen, Luciano M. Prevedello, Matthew T. Bigelow, Richard D. White, Barbaros S. Erdal
URL:http://arxiv.org/abs/2002.10034v1

この論文の概要(機械翻訳による和訳)
この研究では、機械学習ベースのシステムが、初回訪問時に収集された臨床データと画像データのみを処理することにより、軽度認知障害(MCI)患者の認知機能低下率を予測できるかどうかを調査します。 3次元畳み込みニューラルネットワークを利用して、磁気共鳴イメージング(MRI)のボリューム分析と、アーキテクチャの完全に接続されたレイヤーでの非イメージング臨床データの統合を実行します。分析は、アルツハイマー病ニューロイメージングイニシアチブ(ADNI)データセットで実行されます。実験結果は、認知低下と最初の訪問で得られたデータとの間に相関関係があることを確認します。このシステムは、認知機能低下のクラス予測で66.6%の受信者オペレーター曲線下面積(AUC)を達成しました。

Symbolic Querying of Vector Spaces: Probabilistic Databases Meets Relational Embeddings

ベクトル空間のシンボリッククエリ:確率的データベースとリレーショナル埋め込みの融合

著者:Tal Friedman, Guy Van den Broeck
URL:http://arxiv.org/abs/2002.10029v1

この論文の概要(機械翻訳による和訳)
増加する不確実性と不完全な関係データの量に対処するために、確率的データベースとリレーショナル埋め込みモデルからの統合技術を提案します。すべてのクエリが実行される確率モデルを定義するために、確率データベースを形式主義として使用します。これにより、問題を解決するために確率的データベースからの理論とアルゴリズムの豊富な文献を活用できます。この形式化は、任意のリレーショナル埋め込みモデルで使用できますが、十分に定義された結合確率分布の欠如により、単純な問題が明らかに困難になります。これを念頭に置いて、確率的フレームワーク内の典型的な埋め込み仮定を活用するために確率的データベースの観点から設計されたリレーショナル埋め込みモデルである TOを導入します。その定義から導き出すことができる原理的で効率的な推論アルゴリズムを使用して、 TOsがこれらのタスクの効果的で一般的なモデルであることを経験的に実証します。

Deep Multimodal Image-Text Embeddings for Automatic Cross-Media Retrieval

自動クロスメディア検索のためのディープマルチモーダル画像テキスト埋め込み

著者:Hadi Abdi Khojasteh, Ebrahim Ansari, Parvin Razzaghi, Akbar Karimi
URL:http://arxiv.org/abs/2002.10016v1

この論文の概要(機械翻訳による和訳)
この論文では、クロスモーダル検索のための視覚テキスト埋め込みスペースを学習することにより、画像と文章をマッチングするタスクを検討します。テキストと画像の特徴と表現は比較できないため、このようなスペースを見つけることは困難な作業です。この作業では、視覚と言語表現の両方を同時に学習して画像とテキストの類似性を推測するための、エンドツーエンドの深層マルチモーダル畳み込みリカレントネットワークを導入します。モデルは、ヒンジベースのトリプレットランキングを使用して、どのペアが一致(正)で、どのペアが不一致(負)であるかを学習します。共同表現について学ぶために、Twitterから新しく抽出されたツイートのコレクションを活用します。データセットの主な特徴は、画像やツイートがベンチマークと同じように標準化されていないことです。さらに、説明がきちんと構成されているベンチマークとは反対に、写真とツイートの間に高いセマンティック相関がある場合があります。 MS-COCObenchmarkデータセットの実験結果は、このモデルが以前に提示された特定の方法よりも優れており、最新技術と比較して競争力のあるパフォーマンスを持っていることを示しています。コードとデータセットは一般に公開されています。

A Critical View of the Structural Causal Model

構造的因果モデルの批判的見解

著者:Tomer Galanti, Ofir Nabati, Lior Wolf
URL:http://arxiv.org/abs/2002.10007v1

この論文の概要(機械翻訳による和訳)
単変量の場合、単変量の原因と結果の個々の複雑さを比較することにより、相互作用をまったく考慮せずに原因と結果を特定できることを示します。私たちのフレームワークでは、分布の分位点で動作するオートエンコーダーの再構成エラーによって複雑さが捕捉されます。各変数に1つずつある2つのオートエンコーダーの再構築エラーを比較すると、受け入れられた因果性指向性ベンチマークで驚くほど良好に機能することが示されています。したがって、2つのうちどちらが原因であり、どちらが結果であるかについての決定は、因果関係ではなく複雑さに基づいている可能性があります。原因と効果の複雑さのバランスをとることができる多変量の場合、因果モデルのもつれを解いた構造を模倣する新しい敵対訓練方法を提案します。多次元の場合、このようなモデリングは因果関係の方向にのみデータに適合する可能性が高いことを証明します。さらに、一意性の結果は、学習モデルが基礎となる因果および残留(ノイズ)成分を識別できることを示しています。私たちの多次元法は、合成データセットと実世界データセットの両方で文献の方法よりも優れています。

Predictive Sampling with Forecasting Autoregressive Models

予測自己回帰モデルを使用した予測サンプリング

著者:Auke J. Wiggers, Emiel Hoogeboom
URL:http://arxiv.org/abs/2002.09928v1

この論文の概要(機械翻訳による和訳)
自己回帰モデル(ARM)は現在、画像データと音声データの最尤ベースのモデリングを備えた最先端のパフォーマンスを保持しています。一般に、ニューラルネットワークベースのARMは、高速な推論を可能にするように設計されていますが、これらのモデルからのサンプリングは実用的ではありません。このホワイトペーパーでは、予測サンプリングアルゴリズムを紹介します。これは、モデルを損なわずにサンプリングを高速化するためにARMの高速推論プロパティを活用する手順です。予測サンプリングの2つのバリエーション、つまり、ARM固定小数点および学習予測モジュールによるサンプリングを提案します。それらの有効性は、2つの設定で実証されています:i)バイナリMNIST、SVHNおよびCIFAR10の明示的尤度モデリング、およびii)SVHN、CIFAR10およびImagenet32でトレーニングされたオートエンコーダーの離散潜在モデリング。経験的に、ARM推論呼び出しの数とサンプリング速度のオーバーベースラインを大幅に改善しています。

ORCSolver: An Efficient Solver for Adaptive GUI Layout with OR-Constraints

ORCSolver:OR制約付きの適応GUIレイアウトのための効率的なソルバー

著者:Yue Jiang, Wolfgang Stuerzlinger, Matthias Zwicker, Christof Lutteroth
URL:http://arxiv.org/abs/2002.09925v1

この論文の概要(機械翻訳による和訳)
OR制約(ORC)グラフィカルユーザーインターフェイスレイアウトは、従来の制約ベースのレイアウトをフローレイアウトと統合します。これにより、単一のレイアウト仕様のみで、異なるサイズ、向き、またはアスペクト比の画面に適合する柔軟なレイアウトを定義できます。残念ながら、現在のソルバーでORCレイアウトを解決するのは時間がかかり、必要な時間はウィジェットと制約の数とともに指数関数的に増加します。この課題に対処するために、ヒューリスティックな前処理を使用した分岐限定アプローチに基づいた、AdaptiveORCレイアウトの新しい解決手法であるORCSolverを提案します。 。

Do Multi-Hop Question Answering Systems Know How to Answer the Single-Hop Sub-Questions?

マルチホップ質問応答システムは、シングルホップのサブ質問に回答する方法を知っていますか?

著者:Yixuan Tang, Hwee Tou Ng, Anthony K. H. Tung
URL:http://arxiv.org/abs/2002.09919v1

この論文の概要(機械翻訳による和訳)
マルチホップ質問応答(QA)では、質問に回答するために長いテキストのさまざまな部分から情報を取得して統合するモデルが必要です。人間はこのような複雑な質問に答えるには、分割統治アプローチを使用します。このホワイトペーパーでは、マルチホップ質問の上位モデルが、人間のような下位の質問を理解しているかどうかを調査します。マルチホップ複合質問のサブ質問を生成するために、ニューラル分解モデルを採用し、対応するサブ回答を抽出します。複数の最先端のマルチホップQAモデルは、サブ質問の大部分に正しく答えることができませんが、対応するマルチホップ質問は正しく答えられます。これは、これらのモデルが推論パスを真に理解する代わりに、いくつかの部分的な手がかりを使用してマルチホップ質問に答えることを管理していることを示しています。また、サブ質問に回答する際のパフォーマンスを大幅に改善する新しいモデルを提案します。私たちの仕事は、より説明可能なマルチホップQAシステムの構築に向けて一歩前進します。

End-To-End Graph-based Deep Semi-Supervised Learning

エンドツーエンドのグラフベースの深い半教師あり学習

著者:Zihao Wang, Enmei Tu, Zhou Meng
URL:http://arxiv.org/abs/2002.09891v1

この論文の概要(機械翻訳による和訳)
グラフの品質は、グラフの3つの重要な要素であるノード、エッジ、および類似性の尺度(またはエッジの重み)によって決定され、グラフベースの半教師あり学習(SSL)アプローチの成功にとって非常に重要です。最近、動的グラフは、その一部/すべての要因がトレーニングプロセス中に動的に更新されることを意味し、グラフベースの半教師あり学習に有望であることが実証されています。ただし、既存のアプローチでは3つの要素の一部のみを更新し、残りは学習段階で手動で指定します。この論文では、エンドツーエンドの学習方法で3つの要素すべてを同時に最適化するために、小説グラフに基づく半教師付き学習アプローチを提案します。このため、2つのニューラルネットワーク(機能ネットワークと類似性ネットワーク)を連結して、それぞれカテゴリラベルとセマンティック類似性を学習し、ネットワークをトレーニングして、統一されたSSL目的関数を最小化します。また、トレーニングの効率を向上させるためにラプシアン正則化グラフを導入しました。いくつかのベンチマークデータセットに対する広範な実験により、アプローチの有効性が実証されました。

Discriminative Particle Filter Reinforcement Learning for Complex Partial Observations

複雑な部分観測のための識別的粒子フィルタ強化学習

著者:Xiao Ma, Peter Karkus, David Hsu, Wee Sun Lee, Nan Ye
URL:http://arxiv.org/abs/2002.09884v1

この論文の概要(機械翻訳による和訳)
深層強化学習は、Atari、Goなどの洗練されたゲームの意思決定に成功します。しかし、実際の意思決定には、複雑な視覚的観測から抽出された部分的な情報による推論が必要になることがよくあります。この論文では、複雑な部分的観測のための新しい強化学習フレームワークである識別粒子フィルター強化学習(DPFRL)を紹介します。 DPFRLは、部分的な観測時間外の明示的な推論のために、ニューラルネットワークポリシーで微分可能な粒子フィルターをエンコードします。パーティクルフィルターは、学習した判別更新を使用して信念を維持します。これは、意思決定のためにエンドツーエンドでトレーニングされます。標準の生成モデルの代わりに差別的更新を使用すると、特に複雑な視覚的観測を持つタスクのパフォーマンスが大幅に向上することがわかります。これは、意思決定に関係のない複雑な観測のモデリングの困難を回避するためです。さらに、粒子の信念から特徴を抽出するために、モーメント生成関数に基づく新しいタイプの信念特徴を提案します。 DPFRLは、既存のPOMDP RLベンチマークであるFlickering Atari Gamesおよび最新のPOMDP RLベンチマークであるNatural Flickering Atari Gamesの最新のPOMDP RLモデルよりも優れています。さらに、DPFRLは、ハビタット環境での実際のデータを使用した視覚的ナビゲーションに対しても優れたパフォーマンスを発揮します。

Mixed Integer Programming for Searching Maximum Quasi-Bicliques

最大準双曲を検索するための混合整数計画法

著者:Dmitry I. Ignatov, Polina Ivanova, Albina Zamaletdinova
URL:http://arxiv.org/abs/2002.09880v1

この論文の概要(機械翻訳による和訳)
この論文は、2部グラフ(bigraph)の最大準ビクリクシンを見つける問題に関連しています。バイグラフ内の準双曲線は、その「ほぼ」完全なサブグラフです。完全性の緩和はさまざまに理解することができます;ここで、サブグラフは、その密度が少なくとも$ gamma in( 0,1] $。双グラフおよび固定$ gamma $の場合、最大準二次クリークを検索する問題は、誘導されたサブグラフが準二次クリークであり、そのサイズがa混合整数計画法(MIP)に基づいて準二次クリークを検索するいくつかのモデルを提案し、作業効率をテストします。バイクラスタリングにヒントを得た代替モデルを定式化してテストします。このモデルは、準二次クリークとその密度、triclustering textsc {TriBox}によって利用されるものに類似した最小二乗基準を使用します。

On the generalization of bayesian deep nets for multi-class classification

マルチクラス分類のためのベイジアンディープネットの一般化について

著者:Yossi Adi, Yaniv Nemcovsky, Alex Schwing, Tamir Hazan
URL:http://arxiv.org/abs/2002.09866v1

この論文の概要(機械翻訳による和訳)
真のリスクと経験的リスクの違いを評価する一般化の限界は、広く研究されてきました。ただし、境界を取得するために、現在の手法では、一様に制限された損失関数やaLipschitz損失関数などの厳密な仮定を使用します。これらの仮定を回避するために、本書では、Log-Sobolev不等式の矛盾を利用することにより、ベイジアンディープネットの新しい一般化限界を提案します。これらの不等式を使用すると、追加の損失勾配ノルム項が一般化限界に追加されます。これは、直感的にモデルの複雑さの代理です。経験的に、さまざまなディープネットを使用して、この損失勾配ノルム項の影響を分析します。

Optimizing Traffic Lights with Multi-agent Deep Reinforcement Learning and V2X communication

マルチエージェントの深層強化学習とV2X通信による信号機の最適化

著者:Azhar Hussain, Tong Wang, Cao Jiahua
URL:http://arxiv.org/abs/2002.09853v1

この論文の概要(機械翻訳による和訳)
マルチエージェントの深層強化学習とビークルツーエブリシング(V2X)通信を使用して、交通信号の継続時間を最適化するシステムを検討します。このシステムは、信号の持続時間を制御するためのマルチエージェントの独立した共有報酬の分析を目的としています。学習エージェントの信号機は、円形のV2Xカバレッジ内のレーンに沿って情報を取得します。信号機のデュレーションサイクルは、マルコフ決定プロセスとしてモデル化されます。報酬関数の4つのバリエーションを調査します。最初の2つは非共有報酬です。待機数と、信号機の2サイクル間の車両の待機時間に基づきます。 3番目と4番目の機能は、待機中の車に基づく共有報酬、およびすべてのエージェントの待機時間です。各エージェントには、ターゲットネットワークおよび優先順位付けされたエクスペリエンスリプレイによる最適化のためのメモリがあります。 Urban MObility(SUMO)シミュレーターのシミュレーションを通じてマルチエージェントを評価します。この結果は、従来の定期交通管制システムと比較して、交通信号を最適化し、平均待機車を41.5%に削減する提案システムの有効性を証明しています。

Tree++: Truncated Tree Based Graph Kernels

Tree ++:切り捨てられたツリーベースのグラフカーネル

著者:Wei Ye, Zhen Wang, Rachel Redberg, Ambuj Singh
URL:http://arxiv.org/abs/2002.09846v1

この論文の概要(機械翻訳による和訳)
グラフ構造のデータは、多くのアプリケーションドメインで遍在しています。基本的な問題は、それらの類似性を定量化することです。グラフカーネルはこの目的でよく使用され、グラフを部分構造に分解し、これらの部分構造を比較します。ただし、既存のグラフカーネルのほとんどにはスケール適応性のプロパティがありません。つまり、複数レベルの粒度でグラフを比較することはできません。分子などの多くの実世界のグラフは、さまざまなレベルの粒度で構造を示します。この問題に取り組むために、このペーパーではTree ++と呼ばれる新しいグラフカーネルを提案します。 Tree ++の中心には、パスパターングラフカーネルと呼ばれるグラフカーネルがあります。パスパターングラフカーネルは、最初に各頂点をルートとする切り捨てられたBFSツリーを構築し、次に、ルートを切り捨てられたBFSツリー内のすべての頂点へのパスを機能として使用してグラフを表します。パスパターングラフカーネルは、グラフの類似性を細かい粒度でのみキャプチャできます。粗い粒度でグラフの類似性をキャプチャするために、スーパーパスと呼ばれる新しい概念を組み込みます。スーパーパスには、パスの頂点をルートとする切り捨てられたBFSツリーが含まれています。以前のグラフカーネルと比較して、最高の分類精度を達成します。

Signature in Counterparts, a Formal Treatment

カウンターパートの署名、正式な治療

著者:Ron van der Meyden
URL:http://arxiv.org/abs/2002.09827v1

この論文の概要(機械翻訳による和訳)
「カウンターパートの署名」とは、物理的な場所にある共通のコピーに署名を置くのではなく、契約の異なるコピーに当事者が独立して(場合によってはリモートで)署名することにより、2人以上の当事者間の契約を有効にする法的プロセスです。会議:このプロセスは、このプロセスの論理的理解を発展させ、別々のコピーが署名されているという仮定から契約の有効性を正当化するために使用できる多くの公理を開発します。満足のいくアカウントは、構文の自己参照を備えたロジックの恩恵を受けると主張されています。使用される軸は正式なセマンティクスによってサポートされており、このセマンティクスの多くのさらなる特性が調査されています。特に、セマンティクスは、契約が有効な場合、当事者は同意しないが、契約の有効性について相互に合意していること(一般的な知識のような概念)を意味することを示しています。

Deep Reinforcement Learning with Linear Quadratic Regulator Regions

線形二次レギュレーター領域を使用した深層強化学習

著者:Gabriel I. Fernandez, Colin Togashi, Dennis Hong, Lin Yang
URL:http://arxiv.org/abs/2002.09820v1

この論文の概要(機械翻訳による和訳)
実践者は、多くの場合、計算集中型のドメインランダム化に依存して、シミュレーションで訓練された強化学習ポリシーが実世界に確実に移行できるようにします。ただし、実際のシステムではモデル化されていない非線形性があるため、そのようなシミュレートされたポリシーでも、実際の環境での経験を獲得するのに十分な安定性を発揮できない場合があります。この論文では、高度に非線形なシステムであっても、政策訓練されたシミュレーションの出力に対して安定した引力領域を保証する新しい方法を提案します。私たちのコア技術は、「バイアスシフト」ニューラルネットワークを使用してコントローラーを構築し、シミュレーターでネットワークをトレーニングすることです。修正されたニューラルネットワークは、システムの非線形性をキャプチャするだけでなく、状態空間の特定の領域で線形性を確実に保持するため、実際のシステムで安定していることが知られている線形二次レギュレータに似るように調整できます。振り上げ倒立振子のシミュレーションポリシーを実際のシステムに転送することで新しい方法をテストし、その有効性を実証しました。

Assembling Semantically-Disentangled Representations for Predictive-Generative Models via Adaptation from Synthetic Domain

合成ドメインからの適応を介した予測生成モデルのための意味的に解きほぐされた表現の組み立て

著者:Burkay Donderici, Caleb New, Chenliang Xu
URL:http://arxiv.org/abs/2002.09818v1

この論文の概要(機械翻訳による和訳)
ディープニューラルネットワークは、入力データの高レベルの階層表現を形成できます。さまざまな研究者が、これらの表現を使用してさまざまな有用なアプリケーションを実現できることを実証しています。ただし、このような表現は通常、データ内の統計に基づいており、アプリケーションが必要とする可能性のあるセマンティック表現に適合しない場合があります。通常、条件モデルはこの課題を克服するために使用されますが、作成するのが難しく費用がかかる大きな注釈付きデータセットが必要です。この論文では、物理ベースのエンジンの助けを借りて、意味的に整合した表現を代わりに生成できることを示します。これは、分離された属性を持つ合成データセットを作成し、合成データセットのエンコーダーを学習し、合成ドメインからの規定の属性を実ドメインからの属性で増強することにより達成されます。提案された(SYNTH-VAE-GAN)メソッドは、実際のデータラベルに依存することなく、人間の顔の属性の条件付き予測生成モデルを構築できることが示されています。

Neuron Shapley: Discovering the Responsible Neurons

ニューロンシャプリー:責任あるニューロンの発見

著者:Amirata Ghorbani, James Zou
URL:http://arxiv.org/abs/2002.09815v1

この論文の概要(機械翻訳による和訳)
ディープネットワークの予測とパフォーマンスに対する個々のニューロンの寄与を定量化する新しいフレームワークとしてNeuron Shapleyを開発します。ニューロン間の相互作用を考慮することで、Neuron Shapleyは、アクティベーションパターンに基づく一般的なアプローチと比較して、重要なフィルターをより効果的に識別します。興味深いことに、最高のShapleyscoresを持つ30個のフィルターのみを削除すると、InImage-v3 onImageNetの予測精度が事実上破壊されます。これらのいくつかの重要なフィルターを視覚化することにより、ネットワークの機能に関する洞察が得られます。 Neuron Shapleyは柔軟なフレームワークであり、多くのタスクで責任あるニューロンを識別するために適用できます。顔認識における偏った予測の原因となるフィルターや、敵の攻撃に対して脆弱なフィルターを識別する追加のアプリケーションを示します。これらのフィルターを削除すると、モデルをすばやく修復できます。これらすべてのアプリケーションを有効にすることは、Neuron Shapley値を効率的に推定するために開発した新しいマルチアームバンディットアルゴリズムです。

Automatic Cost Function Learning with Interpretable Compositional Networks

解釈可能な合成ネットワークによる自動コスト関数学習

著者:Florian Richoux, Jean-François Baffier
URL:http://arxiv.org/abs/2002.09811v1

この論文の概要(機械翻訳による和訳)
コスト関数ネットワーク(CFN)は、組み合わせの満足度または最適化の問題をモデル化する制約プログラミングの形式です。関数を各制約タイプに関連付けて割り当ての品質を評価することにより、通常のCSP / COP形式の表現力が拡張されますが、問題のモデリングが難しくなります。実際、通常の変数/ドメイン/制約セットに加えて、常に定義が容易ではないコスト関数のセットを提供する必要があります。ここでは、割り当てが有効かどうかを決定する関数が与えられたときに、制約のコスト関数を自動的に学習する方法を提案します。これは、コスト関数を自動的に学習する最初の試みです。私たちの方法は、通常の人工ニューラルネットワークとは異なり、説明可能な結果を​​得ることができるように、解釈可能な構成ネットワークと名付けたニューラルネットワークの変量を使用して、ハミング距離を再現しようとする、監視された方法でコスト関数を学習することを目的としています。実験により、小さな次元で学習した関数は高次元でスケーリングし、ほとんどの制約に対して完全またはほぼ完全なハミング距離を出力することが実験により示されています。このシステムを使用して、コスト関数を自動的に生成し、CSP / COPと同じモデリング作業でCFNの表現力を持たせることができます。

Periodic Q-Learning

定期的なQラーニング

著者:Donghwan Lee, Niao He
URL:http://arxiv.org/abs/2002.09795v1

この論文の概要(機械翻訳による和訳)
ターゲットネットワークの使用は、トレーニングを安定させるための深層強化学習の一般的な方法です。ただし、この手法の理論的な理解はまだ限られています。この論文では、いわゆる周期的Q学習アルゴリズム(略してPQ学習)を研究します。 PQ学習では、オンライン推定とターゲット推定という2つの個別のQ値推定が維持されます。オンライン見積もりは標準のQラーニング更新に従いますが、ターゲット見積もりは定期的に更新されます。標準のQラーニングとは対照的に、PQラーニングは単純な有限時間分析を楽しみ、イプシロン最適ポリシーを見つけるためのサンプルの複雑さを改善します。この結果は、Qラーニングアルゴリズムでターゲット推定値またはネットワークを利用することの有効性の予備的な正当化を提供します。

分野/キーワード:

論文ナビに登録すると・・・
①最新情報をメールでお届け!
  • 話題のニュース一覧
  • 注目のプレスリリース
  • 論文解説・最近のイベント
②論文解説記事の投稿
  • ご自身の論文の解説
  • 読んだ論文のメモ
  • 研究に関する情報のシェア
③セミナー情報の宣伝
  • ご自身が主催するイベント情報を投稿してシェア
  • ユーザーで作るセミナー日程まとめに参加
【併せて読みたい関連記事】
X
- Enter Your Location -
- or -
パスワード再発行
お気に入り
  • Total (0)
0