rnavi

2020-01-30

AI分野論文まとめ【2020年01月30日arXiv公開】

アブストまとめ

View数：1,464

Like0

お気に入り

2020年01月30日に発表されたAI分野の論文25本のAbstractをまとめて和訳しました。

この記事の見出し

1 On the Convergence of Artificial Intelligence and Distributed Ledger Technology: A Scoping Review and Future Research Agenda
2 Human Action Performance using Deep Neuro-Fuzzy Recurrent Attention Model
3 AMR Similarity Metrics from Principles
4 Stochastic L-system Inference from Multiple String Sequence Inputs
5 MEMO: A Deep Network for Flexible Combination of Episodic Memories
6 Interventions and Counterfactuals in Tractable Probabilistic Models: Limitations of Contemporary Transformations
7 On Learning Vehicle Detection in Satellite Video
8 Data integration and prediction models of photovoltaic production from Brazilian northeastern
9 Virtual KITTI 2
10 Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning
11 Towards Multi-perspective conformance checking with fuzzy sets
12 Bayesian Neural Architecture Search using A Training-Free Performance Metric
13 PulseSatellite: A tool using human-AI feedback loops for satellite image analysis in humanitarian contexts
14 Interpretable Rumor Detection in Microblogs by Attending to User Interactions
15 Bounded Incentives in Manipulating the Probabilistic Serial Rule
16 Facebook Ads Monitor: An Independent Auditing System for Political Ads on Facebook
17 Landmark2Vec: An Unsupervised Neural Network-Based Landmark Positioning Method
18 The KEEN Universe: An Ecosystem for Knowledge Graph Embeddings with a Focus on Reproducibility and Transferability
19 Parameter Sharing in Coagent Networks
20 Distal Explanations for Explainable Reinforcement Learning Agents
21 Causal query in observational data with hidden variables
22 Towards Learning Multi-agent Negotiations via Self-Play
23 An Adaptive and Near Parameter-free Evolutionary Computation Approach Towards True Automation in AutoML
24 Bringing Stories Alive: Generating Interactive Fiction Worlds
25 Interpreting Cloud Computer Vision Pain-Points: A Mining Study of Stack Overflow

On the Convergence of Artificial Intelligence and Distributed Ledger Technology: A Scoping Review and Future Research Agenda

人工知能と分散型台帳技術の収束について：スコーピングレビューと今後の研究課題

著者：Konstantin D. Pandl, Scott Thiebes, Manuel Schmidt-Kraepelin, Ali Sunyaev
URL：http://arxiv.org/abs/2001.11017v1

この論文の概要（機械翻訳による和訳）
人工知能（AI）と分散型台帳技術（DLT）の開発は、現在、学界と実践の活発な議論をリードしています。 AIはデータを処理して、以前は人間だけが実行できると考えられていたタスクを実行します。 DLTは不確実な環境で行動し、参加者のグループ間でコンセンサスオーバーデータを作成します。最近の記事では、両方のテクノロジーが相互に補完しています。例には、安全な分散元帳の設計や、複数のノードに分散された関連学習システムの作成が含まれます。これにより、技術の収束が可能になり、過去において、主要なIT製品の革新への道が開かれました。前の研究では、AIとDLTの収束のいくつかの潜在的な利点が強調されていますが、両方の技術の今後の現実の統合事例を説明するための限られた理論的フレームワークのみを提供しています。私たちは、以前の研究について体系的な文献レビューを行い、厳密に導き出された将来の研究機会を提供することにより貢献することを目指しています。分析では、AIとDLTがデータを交換する方法、およびこれらの統合原則を使用して新しいシステムを構築する方法を特定します。それに基づいて、将来の研究のために未解決の質問を提示します。この作業は、AIまたはDLTをアクティブにした研究者が現在の分野の限界を克服するのを助け、エンジニアはこれらの技術の収束とともにシステムを開発するのに役立ちます。

Human Action Performance using Deep Neuro-Fuzzy Recurrent Attention Model

ディープニューロファジィリカレントアテンションモデルを使用した人間の行動パフォーマンス

著者：Nihar Bendre, Nima Ebadi, Paul Rad
URL：http://arxiv.org/abs/2001.10953v1

この論文の概要（機械翻訳による和訳）
多くのコンピュータービジョンの出版物は、実行されるアクションの強度ではなく、人間のアクションの認識と分類を区別することに焦点を当てています。人間の行動のパフォーマンスを決定する強度のインデックス付けは、ビデオ入力に存在する不確実性と情報不足のため、困難な作業です。この不確実性を改善するために、このペーパーでは、ファジーロジックルールをニューラルベースのアクション認識モデルと組み合わせて、アクションの強度を強烈または軽度としてインデックス付けしました。このアプローチでは、ファジィロジックルールを定義して、時空間LSTMによって生成された重みを使用して、実行されたアクションの強度インデックスを検出し、実験を通じてアクション強度のインデックス付けが可能であることを示します。統合されたモデルをさまざまなアクション強度を持つ人間のアクションのビデオに適用することで分析し、89.16％の精度の強度インデックス作成用データセットを達成することができました。統合モデルは、人間の行動の強度指数を効果的に推定するファジー推論モジュールの能力を実証しています。

AMR Similarity Metrics from Principles

原則からのAMR類似性メトリック

著者：Juri Opitz, Letitia Parcalabescu, Anette Frank
URL：http://arxiv.org/abs/2001.10929v1

この論文の概要（機械翻訳による和訳）
Abstract MeaningRepresentation（AMR）グラフを比較するために、さまざまなメトリックが提案されています。正規のSmatchメトリック（Cai and Knight、2013）は、あるグラフから別のグラフに変数を並べて、一致するトリプルを比較します。最近リリースされたSemBleuメトリック（Song and Gildea、2019）は、機械翻訳メトリックBleu（Papineni et al。、 2002）、可変アライメントのステップを除去し、よりグローバルなグラフプロパティの取得を目指して計算効率を向上させます。私たちの目的は3つあります。 ii）SmatchとSemBleuの徹底的な分析を行い、後者がいくつかの望ましくない特性を示すことを示します。例えば、それは識別不能ルールのアイデンティティに違反し、制御が難しいバイアスを導入します; iii）非常にわずかな意味の逸脱のみにより慈善的であり、すべての確立された基準の達成を目標とする新しいメトリックS2matchを提案します。その適合性を評価し、SmatchおよびSemBleuに対する利点を示します。

Stochastic L-system Inference from Multiple String Sequence Inputs

複数の文字列シーケンス入力からの確率的Lシステム推論

著者：Jason Bernard, Ian McQuillan
URL：http://arxiv.org/abs/2001.10922v1

この論文の概要（機械翻訳による和訳）
Lindenmayerシステム（Lシステム）は、文字列書き換えルールで構成される文法システムです。ルールは、文字列内のすべてのシンボルを後続の文字列と並行して置き換えて、次の文字列を生成し、この手順を繰り返します。確率論的なコンテキストフリーLシステム（S0Lシステム）では、すべてのシンボルに1つ以上の書き換えルールがあり、それぞれに選択の確率が関連付けられています。適切に構成された書き換えルールは、各派生文字列がシミュレーションのステップを説明する一部の自然および人間工学プロセスのモデリングおよびシミュレーションに役立つことがわかっています。通常、プロセスは、プロセスの測定値またはドメインの知識に基づいて細心の注意を払ってルールを構築する専門家によってモデル化されます。このペーパーでは、一連の文字列シーケンスを入力として、所見とLシステムの自動化されたアプローチを示します。実装されたツールは、S0Lシステム用のプラントモデル推論ツール（PMIT-S0L）と呼ばれます。PMIT-S0Lは、テストスイートで960個の手続き的に生成されたS0Lシステムを使用して評価され、それぞれが入力文字列の生成に使用され、PMIT-S0Lはシーケンスのみからシステムを推測するために使用されます。評価により、PMIT-S0Linfersは12時間以内にそれぞれ最大9個の書き換えルールを持つS0Lシステムを示します。さらに、テストスイートの100％のケースで正しい元の書き換えルールを見つけるには3つの文字列シーケンスで十分であることがわかります。、および6文字列のシーケンスにより、関連する確率の差が約1％以下に減少します。

MEMO: A Deep Network for Flexible Combination of Episodic Memories

メモ：エピソードメモリの柔軟な組み合わせのためのディープネットワーク

著者：Andrea Banino, Adrià Puigdomènech Badia, Raphael Köster, Martin J. Chadwick, Vinicius Zambaldi, Demis Hassabis, Caswell Barry, Matthew Botvinick, Dharshan Kumaran, Charles Blundell
URL：http://arxiv.org/abs/2001.10913v1

この論文の概要（機械翻訳による和訳）
外部メモリを備えたニューラルネットワークアーキテクチャを開発している最近の研究では、多くの場合、ベンチマークbAbI質問および回答データセットが使用されています。ここでは、既存のメモリ拡張アーキテクチャの推論能力をより注意深く調べるために、メモリベースの推論神経科学文献からの非定型連想推論タスクを採用しました。このタスクは、推論の本質、つまり複数の事実または記憶に分散した要素間の遠い関係の評価を捉えると考えられています。驚いたことに、現在のアーキテクチャは長距離の関連付けを推論するのに苦労していることがわかりました。パス内のノード間の最短パスを見つけることを含むより複雑なタスクで同様の結果が得られました。そのため、より長い距離を推論する能力を備えたMEMOを開発しました。これは、2つの新しいコンポーネントを追加することで達成されました。まず、外部メモリに格納されているメモリ（ファクト）と、外部メモリのこれらのファクトを構成するアイテムとの分離を導入します。第二に、回答が生成される前に可変数の「メモリホップ」を許可する適応検索メカニズムを利用します。 MEMOは、bAbIの最新の結果と一致するだけでなく、新しい推論タスクを解決することができます。

Interventions and Counterfactuals in Tractable Probabilistic Models: Limitations of Contemporary Transformations

実行可能確率モデルにおける介入と反事実：現代の変換の限界

著者：Ioannis Papantonis, Vaishak Belle
URL：http://arxiv.org/abs/2001.10905v1

この論文の概要（機械翻訳による和訳）
近年、機械学習モデル一般、特に再生モデルにおける因果関係特性の研究に関心が高まっています。それは十分に動機付けられていますが、確率的推論の基本的な計算の難しさを継承し、正確な推論を扱いにくくしています。確率論的扱いやすいモデルも最近出現し、モデルは通常、データから学習されるモデルのサイズの時間線形で条件付き限界値を計算できることを保証しています。（SPN）および確率的決定論的ダイアグラム（PSDD）は、効率的な関数表現を活用し、高木幅モデルもキャプチャします。このホワイトペーパーでは、次の技術的な質問をします。これらのモデルによって表される、または学習される分布を使用して、介入や反事実に関する推論などの因果クエリを実行できますか。そのようなモデルをベイジアンネットワークに変換することに関する既存のアイデアにアピールすることで、私たちはほとんど否定的に答えます。 SPNを因果グラフに変換すると、介入推論が周辺分布の計算に減ることを示します。言い換えれば、些細な因果推論のみが可能です。 PSDDの場合、状況はわずかに良くなります。まず、PSDDから因果グラフを構築するためのアルゴリズムを提供します。これにより、拡張変数が導入されます。元の変数に介入すると、再び限界分布になりますが、増強された変数に介入すると、PSDに決定論的であるにもかかわらずそれでも因果セマンティクスを提供できます。

On Learning Vehicle Detection in Satellite Video

衛星ビデオにおける学習車両検出について

著者：Roman Pflugfelder, Axel Weissenfeld, Julian Wagner
URL：http://arxiv.org/abs/2001.10900v1

この論文の概要（機械翻訳による和訳）
航空画像や衛星画像での車両検出は、リモートセンシング画像の全体サイズと比較してピクセルの外観が小さいため、依然として困難です。このシナリオでは、リッチなテクスチャ、画像サイズとオブジェクトサイズの小さな中程度の比率などの暗黙の仮定に違反するため、従来のオブジェクト検出方法は非常に頻繁に失敗します。衛星ビデオは、誘導バイアスとして一時的な一貫性をもたらす非常に新しいモダリティです。衛星ビデオでの車両検出のアプローチは、バックグラウンド減算、フレーム差分、または中程度のパフォーマンス（0.26-0.82 $ F_1 $スコア）を示すサブスペースメソッドを使用します。この作業では、衛星ビデオの広域モーションイメージ（WAMI）に最近の深層学習を適用することを提案しています。最初のアプローチで、PlanetのSkySat-1LasVegasビデオで比較可能な結果（0.84 $ F_1 $）を示し、さらに改善の余地があります。

Data integration and prediction models of photovoltaic production from Brazilian northeastern

ブラジル北東部の太陽光発電のデータ統合と予測モデル

著者：Hugo Abreu Mendes, Henrique Ferreira Nunes, Paulo Salgado Gomes de Mattos Neto
URL：http://arxiv.org/abs/2001.10866v1

この論文の概要（機械翻訳による和訳）
社会のすべての生産的な部門は、彼らの費用をうまくコントロールできるようにするための見積もりが必要です。エネルギー事業では、電力会社はこの情報を使用してグリッドの電力フローを制御します。太陽光発電システムのより良いエネルギー生産推定のためには、複数の地理空間変数と気象変数を結合する必要があります。この作業では、生産予測モデル、基地局測定、および実際の生産能力を備えたアサテライトデータ統合プラットフォームの作成を提案します。この作業は、生産的利益を改善し、新しい企業の監視と監督を容易にする空間的および時間的生産推定値を生成する統計的、確率的および人工知能モデルを提示します。

Virtual KITTI 2

バーチャルKITTI 2

著者：Yohann Cabon, Naila Murray, Martin Humenberger
URL：http://arxiv.org/abs/2001.10773v1

この論文の概要（機械翻訳による和訳）
このホワイトペーパーでは、KITTIトラッキングベンチマークの5つのシーケンスクローンで構成される、よく知られたVirtual KITTIdatasetの更新バージョンを紹介します。さらに、データセットは、気象条件（霧、雨など）やカメラ構成の変更など、これらのシーケンスのさまざまなバリエーションを提供します（例：15度回転）。各シーケンスに対して、RGB、深度、クラスセグメンテーション、インスタンスセグメンテーション、フロー、およびシーンフローデータを含む複数の画像セットを提供します。カメラのパラメーターとポーズ、および車両の位置も利用できます。データセットの機能の一部を紹介するために、自動運転の分野の最先端のアルゴリズムを使用して、関連する複数の実験を実行しました。データセットは、https：//europe.naverlabs.com/Research/Computer-Vision/Proxy-Virtual-Worldsからダウンロードできます。

Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning

表形式強化学習のための漸近的に効率的なオフポリシー評価

著者：Ming Yin, Yu-Xiang Wang
URL：http://arxiv.org/abs/2001.10742v1

この論文の概要（機械翻訳による和訳）
強化学習のポリシー外評価の問題を検討します。目標は、ロギングポリシー$ mu $を実行して収集されたオフラインデータを使用して、ターゲットポリシー$ pi $の予想報酬を推定することです。この問題に対する標準的な重要度サンプリングベースのアプローチは、時間範囲$ H $で指数関数的にスケーリングする分散の影響を受けます。。特に、有限な状態と潜在的に無限のアクション。ただし、MSEの境界は、Cramer-Raoの下限$ Omega（H ^ 2 / n）$からまだ$ H $の係数です。この論文では、MIS推定量を単純に修正することで、アクション空間が有限であれば、Cramer-Raolower境界に漸近的に到達できることを証明します。また、高確率のエラー境界を持つMIS推定器を構築するための一般的な方法も提供します。

Towards Multi-perspective conformance checking with fuzzy sets

ファジィ集合による多視点適合性チェックに向けて

著者：Sicui Zhang, Laura Genga, Hui Yan, Xudong Lu, Huilong Duan, Uzay Kaymak
URL：http://arxiv.org/abs/2001.10730v1

この論文の概要（機械翻訳による和訳）
プロセスモデルとプロセスの非現実性の実行との間の可能な不一致を特定するために、適合性チェック技術が広く採用されています。しかし、最先端のアプローチでは、逸脱の鮮明な評価が採用されており、その結果、小さな違反は重要な違反と同じレベルで考慮されます。これは、提供される診断の品質に影響を及ぼします。特に、かなり小さな違反に関してある程度の耐性がある場合は、プロセスの柔軟性が損なわれます。この作業では、違反に対するアクターの許容度を表し、実行コンプライアンスを評価するときに偏差の重大度を考慮することができる新しいアプローチを提案します。提供される診断の品質を改善するだけでなく、偏差評価の許容範囲を許可することで、適合性チェック技術の柔軟性が向上し、間接的に、プロセス管理システム全体の回復力を向上させる方法が生まれると主張します。

Bayesian Neural Architecture Search using A Training-Free Performance Metric

トレーニング不要のパフォーマンスメトリックを使用したベイジアンニューラルアーキテクチャ検索

著者：Andrés Camero, Hao Wang, Enrique Alba, Thomas Bäck
URL：http://arxiv.org/abs/2001.10726v1

この論文の概要（機械翻訳による和訳）
リカレントニューラルネットワーク（RNN）は、時系列予測の強力なアプローチです。ただし、それらのパフォーマンスは、アーキテクチャとハイパーパラメータの設定に大きく影響されます。 RNNsisのアーキテクチャ最適化は時間のかかるタスクであり、検索スペースは通常、実数値、整数値、およびカテゴリ値の混合です。ネットワークのサイズを縮小および拡大できるようにするために、アーキテクチャの表現はしばしば可変長を持ちます。この論文では、ベイジアン最適化（BO）アルゴリズムのバリアントを使用して、アーキテクチャ最適化の問題に取り組むことを提案します。候補アーキテクチャの評価時間を短縮するために、ネットワークパフォーマンスを推定するトレーニング不要の方法である平均絶対誤差ランダムサンプリング（MRS）がBOの目的関数として採用されています。また、可変長アーキテクチャ表現に対処するための3つの固定長エンコーディングスキームを提案します。その結果、RNNの正確かつ効率的な設計に関する新しい視点が得られ、3つの問題について検証しています。私たちの調査結果は、1）BOアルゴリズムは、提案されたエンコーディングスキームを使用してさまざまなネットワークアーキテクチャを探索し、適切に機能するアーキテクチャを設計することができ、2）MRSを使用することで、実際のトレーニング手順から得られたアーキテクチャと比較してパフォーマンスを損なうことなく、最適化時間が大幅に短縮されることを示しています。

PulseSatellite: A tool using human-AI feedback loops for satellite image analysis in humanitarian contexts

PulseSatellite：人道的文脈での衛星画像解析のために人間AIフィードバックループを使用するツール

著者：Tomaz Logar, Joseph Bullock, Edoardo Nemni, Lars Bromley, John A. Quinn, Miguel Luengo-Oroz
URL：http://arxiv.org/abs/2001.10685v1

この論文の概要（機械翻訳による和訳）
自然災害や紛争に対する人道的対応は、衛星画像分析により支援できます。人道的な文脈では、非常に具体的な衛星画像分析タスクは、運用サポートを提供するために正確かつタイムリーに実行する必要があります。 PulseSatelliteは、オンザフライで再訓練し、特定の人道的状況と地理に適応できるニューラルネットワークモデルを活用する共同衛星画像解析ツールです。 PulseSatelliteの機能を示す、避難所と洪水をそれぞれマッピングする2つの事例研究を紹介します。

Interpretable Rumor Detection in Microblogs by Attending to User Interactions

ユーザーインタラクションへの参加によるマイクロブログでの解釈可能な噂の検出

著者：Ling Min Serena Khoo, Hai Leong Chieu, Zhong Qian, Jing Jiang
URL：http://arxiv.org/abs/2001.10667v1

この論文の概要（機械翻訳による和訳）
マイクロブログでの本物の主張と偽の主張に対するコミュニティの反応を区別することを学ぶことで、噂の検出に対処します。既存の最新モデルは、会話型ツリーをモデル化するツリーモデルに基づいています。ただし、ソーシャルメディアでは、返信を投稿するユーザーは特定のユーザーではなくスレッド全体に返信する場合があります。トランスフォーマーネットワークのマルチヘッドアテンションメカニズムとツイート間の長距離相互作用をモデル化するために、ポストレベルアテンションモデル（PLAN）を提案します。このモデルのバリエーションを調査しました：（1）変圧器ネットワークにツリー構造情報を組み込む構造認識自己注意モデル（StA-PLAN）、および（2）階層トークンおよび事後レベル注意モデル（StA-HiTPLAN）トークンレベルの自己注意を伴う文表現。私たちの知る限り、私たちは2つの噂検出データセット（PHEMEデータセット、Twitter15およびTwitter16データセット）でモデルを評価した最初の人です。私たちの最高のモデルは、両方のデータセットの現在の最先端モデルよりも優れていることを示しています。さらに、アテンションメカニズムにより、トークンレベルとポストレベルの両方で噂検出の予測を説明できます。

Bounded Incentives in Manipulating the Probabilistic Serial Rule

確率的逐次規則の操作における制限されたインセンティブ

著者：Zihe Wang, Zhide Wei, Jie Zhang
URL：http://arxiv.org/abs/2001.10640v1

この論文の概要（機械翻訳による和訳）
確率的シリアルメカニズムは、その望ましい公平性と効率性でよく知られています。これは、ランダム割り当て問題の最も顕著なプロトコルの1つです。ただし、確率的シリアルはインセンティブと互換性がないため、これらの望ましいプロパティは、エージェントの真の好みではなく、エージェントの宣言された好みのみを保持します。戦略的行動による実質的な効用の獲得は、利己的なエージェントがメカニズムを操作するきっかけとなり、実際にメカニズムを採用するという非常に基礎を覆すでしょう。このペーパーでは、個々のエージェントが戦略的操作によってその有用性を高めることができる範囲を特徴付けます。メカニズムのインセンティブ比が$ frac {3} {2} $であることを示します。つまり、エージェントがその設定を誤って報告することはできず、その有用性は、真実を報告するときの1.5倍以上になります。この比率は、エージェントが他のエージェントのレポートに関する完全な情報を持ち、一般的に計算上手に負えない場合でも最適な応答戦略を見つけ出すことを可能にする最悪のケースの保証です。この最悪のケースの研究を補完するために、実験によりエージェントのユーティリティゲインをさらに評価します。実験は、ルールを操作するエージェントのインセンティブが非常に限られていることを示しています。これらの結果は、戦略的操作に対する確率的シリアルの堅牢性にいくらかの光を当てました。これは、インセンティブに対応していないことを知るよりも一歩進んでいます。

Facebook Ads Monitor: An Independent Auditing System for Political Ads on Facebook

Facebook Ads Monitor：Facebookの政治広告用の独立監査システム

著者：Márcio Silva, Lucas Santos de Oliveira, Athanasios Andreou, Pedro Olmo Vaz de Melo, Oana Goga, Fabrício Benevenuto
URL：http://arxiv.org/abs/2001.10581v1

この論文の概要（機械翻訳による和訳）
2016年の米国大統領選挙は、Facebookでのターゲット広告の濫用によって特徴付けられました。 2018年のブラジルの選挙で発生する同じような悪用のリスクを懸念して、ブラジルのFacebookで政治広告を監視するための独立した監査システムを設計および展開しました。 Todoは、Facebookを使用してボランティアのタイムラインから広告を収集するために、最初にブラウザプラグインを適合させました。 2000人以上のボランティアにプロジェクトを支援し、ツールをインストールするよう説得しました。次に、Convolution NeuralNetwork（CNN）を使用して、単語の埋め込みを使用して政治的なFacebook広告を検出します。アプローチを評価するために、10k広告のデータコレクションを非政治的または非政治的に手動でラベル付けしてから、従来の教師付き機械学習方法と比較することにより、政治的広告を識別するための提案されたアプローチの詳細な評価を提供します。最後に、政治に関連すると特定された広告を表示する実際のシステムを展開しました。 Facebookの広告ライブラリには、政治家向けのすべての政治的な広告が存在するわけではないことに気付きました。私たちの結果は、政治広告を宣言するための執行メカニズムの重要性と、独立した監査プラットフォームの必要性を強調しています。

Landmark2Vec: An Unsupervised Neural Network-Based Landmark Positioning Method

Landmark2Vec：教師なしニューラルネットワークベースのランドマーク配置方法

著者：Alireza Razavi
URL：http://arxiv.org/abs/2001.10568v1

この論文の概要（機械翻訳による和訳）
ランドマークから取得した測定値からの教師なしランドマークマップ推定のためのニューラルネットワークベースの方法が導入されています。ネットワークのトレーニングに必要な測定値は、エージェントがランドマークから観測/受信した信号です。ここでは、ランドマーク、エージェント、およびエージェントがランドマークから取得した測定値の定義がかなり広くなっています。または、建物内のWiFiアクセスポイントなどの無線送信機である場合があります。測定値は、人（エージェント）が携帯するモバイルデバイスから受信したReceivedSignal Strength（RSS）です。次に、マップ推定の目標は、スケール、回転、およびシフトまでのランドマークの位置を見つけることです（ランドマークのトポロジカルマップ）。 $ L $のランドマークがあると仮定すると、測定値はその地域で収集された$ L times 1 $ベクトルになります。浅いネットワークは、グラウンドトゥルース情報なしでマップを学習するように訓練されます。

The KEEN Universe: An Ecosystem for Knowledge Graph Embeddings with a Focus on Reproducibility and Transferability

KEEN Universe：再現性と転送可能性に焦点を当てた知識グラフ埋め込みのエコシステム

著者：Mehdi Ali, Hajira Jabeen, Charles Tapley Hoyt, Jens Lehman
URL：http://arxiv.org/abs/2001.10560v1

この論文の概要（機械翻訳による和訳）
機械学習タスクに知識グラフを使用するために、連続ベクトル空間に知識グラフ（KG）を埋め込むという新しい傾向があります。最近、他のノードとのエッジに依存するノードの類似性など、KGの構造的特性を維持しようとしながら、低次元表現を学習する多くの知識グラフ埋め込み（KGE）モデルが提案されています。 KGEは、新規リンクの予測やエンティティの曖昧性解消など、KG内のタスクに対処するために使用できます。また、質問への回答や事実確認などの下流のタスクにも使用できます。全体として、これらのタスクはセマンティックWebコミュニティに関連しています。それらの人気にもかかわらず、KGE実験の再現性と、提案されたKGEモデルの機械学習コミュニティ外の研究分野への移転可能性は、大きな挑戦になる可能性があります。したがって、我々は、再現性と移動可能性に重点を置いて開発したナレッジグラフ埋め込みのエコシステムであるKEENユニバースを紹介します。 KEENユニバースは現在、PythonパッケージPyKEEN（Python KnowlEdge EmbeddiNgs）、BioKEEN（Biological KnowlEdgeEmbeddiNgs）、およびトレーニングされたKGEモデルをコミュニティと共有するためのKEEN Model Zooで構成されています。

Parameter Sharing in Coagent Networks

Coagentネットワークでのパラメーター共有

著者：Modjtaba Shokrian Zini
URL：http://arxiv.org/abs/2001.10474v1

この論文の概要（機械翻訳による和訳）
本論文では、CoagentNetwork Policy Gradient Theorem（Kostas et。al。、2019）を、関連する関数近似器間でパラメーターが共有されるコンテキストに一般化する定理を証明することを目的としています。これにより、パラメータ共有の任意のパターンを使用し、ネットワークのグラフ構造の自由度を活用して、特定のタスクでのリレーショナルバイアスを活用するための理論的基盤が提供されます。別のアプリケーションとして、結果を適用して、最初に（Riemer et。al。、2019）で示された階層オプションの批評家PolicyGradient定理のより直感的な証明を提供します。

Distal Explanations for Explainable Reinforcement Learning Agents

説明可能な強化学習エージェントの遠位説明

著者：Prashan Madumal, Tim Miller, Liz Sonenberg, Frank Vetere
URL：http://arxiv.org/abs/2001.10284v1

この論文の概要（機械翻訳による和訳）
因果説明は、因果連鎖を介してイベントの経過を理解する直感的な方法を提示し、人間が説明に使用する顕著なモデルとして認知科学で広く受け入れられています。重要なことに、因果モデルは機会連鎖を生成できます。これは、「AがBを有効にし、Bが原因C」の形式を取ります。人間とエージェントの実験データの機会連鎖の概念を基に、さまざまなモデルの説明を参加者に提示し、エージェントの行動に関する独自の説明を提供するように依頼します。結果は、人間が実際に機会連鎖の概念を人工エージェントの行動を記述するために頻繁に使用していることを示しています。最近、action-influenceモデルがモデルフリー強化学習（RL）の因果説明を提供するために提案されました。これらのモデルは反事実を生成することができます—発生しなかったが異なる条件の下で発生する可能性のあるもの—それらは機会連鎖の説明を生成する能力に欠けています。意思決定ツリーと因果モデルを使用して反事実と機会連鎖を分析できる遠位説明モデルを導入します。リカレントニューラルネットワークを使用して機会連鎖を学習し、意思決定ツリーを使用してタスク予測と生成された反事実の精度を向上させます。異なるRLアルゴリズムを使用して、6つのRLベンチマークでモデルを計算的に評価し、タスク予測でモデルのパフォーマンスが向上することを示します。 3つのシナリオを解決する際のRLエージェントの動作の説明を受ける90人の参加者を対象とした研究について報告します。1）敵対者。 2）捜索と救助。 3）人間とエージェントの共同シナリオ。タスクの予測と説明の主観的な満足度を通してエージェントの参加者の理解を調査し、2つのベースライン説明モデルと比較して、3つのシナリオよりも遠位説明モデルの結果が改善されることを示します。

Causal query in observational data with hidden variables

隠された変数を持つ観測データの因果クエリ

著者：Debo Cheng, Jiuyong Li, Lin Liu, Jixue Liu, Kui Yu, Thuc Duy Le
URL：http://arxiv.org/abs/2001.10269v2

この論文の概要（機械翻訳による和訳）
この論文は、操作変数と結果に影響するもっともらしい交絡変数のセットが与えられている間、変数を「操作」するとき、結果の変化を探す目的で、隠された変数を持つ観測データの因果クエリの問題を議論します。操作された変数の因果効果を推定するこのような「実験データ」は、履歴データを使用した実験計画の検証や、新しい関係を研究する際の混乱者の探索に役立ちます。しかし、因果効果推定のための既存のデータ駆動型の方法は、高次元データのスケーラビリティの低さ、グローバルな因果構造学習アルゴリズムで使用されるヒューリスティックによる推定精度の低さ、データに隠れた変数が避けられない場合の因果充足性の推定など、いくつかの大きな課題に直面しています。この論文では、局所探索を使用して、現実的な前処理の仮定の下で観測データから因果効果を推定するための調整（または交絡）変数のスーパーセットを見つけるための定理を開発します。因果効果の不偏推定値が、調整変数のスーパーセットによって推定された因果効果セットで得られるという定理。開発された定理に基づいて、因果クエリのためのデータ駆動型アルゴリズムを提案します。実験により、提案されたアルゴリズムは、隠された変数を使用した既存のデータ駆動型の因果効果推定法よりも高速であり、より良い因果効果推定を生成することが示されています。アルゴリズムによって推定された因果効果は、ドメイン知識を使用した最先端の方法による因果効果と同等です。

Towards Learning Multi-agent Negotiations via Self-Play

セルフプレイによるマルチエージェント交渉の学習に向けて

著者：Yichuan Charlie Tang
URL：http://arxiv.org/abs/2001.10208v1

この論文の概要（機械翻訳による和訳）
洗練された堅牢で安全な順次決定を行うことは、インテリジェントシステムの中心です。これは、エージェントが他のエージェントの意図と考えられる将来のアクションを予測する必要がある複雑なマルチエージェント環境での計画にとって特に重要です。従来の方法は、問題をマルコフ決定プロセスとして定式化しますが、ソリューションは多くの場合、さまざまな仮定に依存しており、コーナーケースが提示されると脆弱になります。対照的に、深層強化学習（Deep RL）は、環境の探索、相互作用、学習を同時に行うことで、ポリシーを見つけるのに非常に効果的です。強力なDeep RLパラダイムを活用して、セルフプレイの反復手順が徐々に多様な環境を作成し、洗練された堅牢なマルチエージェントポリシーの学習につながることを実証します。これは、トラフィックを合流させるための挑戦的なマルチエージェントシミュレーションで実証されています。環境は単純なものから始まりますが、トレーニングの進行に合わせて、エージェントの「動物園」にますます多様化するエージェントのセットを繰り返し追加することで、複雑さを増しています。定性的には、私たちのポリシーは、セルフプレイを通じて、防御的な運転、追い越し、譲歩、および他のエージェントに意図を伝えるための信号灯の使用などの興味深い行動を自動的に学習することがわかります。さらに、定量的に、合体操作の成功率が63％から98％以上に劇的に改善されたことを示しています。

An Adaptive and Near Parameter-free Evolutionary Computation Approach Towards True Automation in AutoML

AutoMLの真の自動化に向けた、適応性があり、パラメータがほとんどない進化的計算アプローチ

著者：Benjamin Patrick Evans, Bing Xue, Mengjie Zhang
URL：http://arxiv.org/abs/2001.10178v1

この論文の概要（機械翻訳による和訳）
進化的計算方法の一般的な主張は、人間の介入を必要とせずに良い結果を達成できるということです。ただし、これに対する批判の1つは、優れたパフォーマンスを実現するために調整する必要があるハイパーパラメーターがまだあるということです。この作業では、手動で指定する必要なく、進化全体でハイパーパラメーター値を適応させる、「パラメーターなし」に近い遺伝的プログラミング手法を提案します。これを（TPOTを拡張することにより）自動機械学習の領域に適用し、人間の入力がないことを効果的に主張できるパイプラインを作成し、結果が、手動で選択されたハイパーパラメーター値を使用する既存の最先端技術と競合することを示します。パイプラインは、ランダムに選択された推定器から始まり、競合するパイプラインに自動的に進化します。この作業は、AutoMLへの真に自動化されたアプローチを目指しています。

Bringing Stories Alive: Generating Interactive Fiction Worlds

ストーリーを生き生きさせる：インタラクティブなフィクションの世界を生成する

著者：Prithviraj Ammanabrolu, Wesley Cheung, Dan Tu, William Broniec, Mark O. Riedl
URL：http://arxiv.org/abs/2001.10161v1

この論文の概要（機械翻訳による和訳）
ワールドビルディングは、ナラティブインテリジェンスを必要とするあらゆるタスクの基盤を形成します。この作品では、自然言語を使用してプレイヤーが「見る」「話す」テキストベースの世界、つまりインタラクティブなフィクションの世界を手続き的に生成することに焦点を当てています。これらの世界を生成するには、意味的に一貫性があり、興味深く、一貫性があることに加えて、日常的かつテーマ的な常識的な優先順位を参照する必要があります。インスピレーションとして既存のストーリープロットを使用して、位置やオブジェクトなどの世界構造に関する基本情報をエンコードする部分的な知識のグラフを最初に抽出する方法を提示します。この知識グラフは、テーマ知識を利用して自動的に完成し、他の世界を一新する神経言語生成モデルを導くために使用されます。人間の参加者ベースの評価を実行し、認知モデルを抽出して入力するニューラルモデルの能力をテストし、ルールベースおよび人間が作成したベースラインに対して条件付けられた言語を生成します。コードは、https：//github.com/rajammanabrolu/WorldGenerationで入手できます。

Interpreting Cloud Computer Vision Pain-Points: A Mining Study of Stack Overflow

クラウドコンピュータービジョンの問題点の解釈：スタックオーバーフローのマイニング研究

著者：Alex Cummaudo, Rajesh Vasa, Scott Barnett, John Grundy, Mohamed Abdelrazek
URL：http://arxiv.org/abs/2001.10130v1

この論文の概要（機械翻訳による和訳）
インテリジェントサービスはますます普及しています。アプリケーション開発者は、computervisionなどの分野の最新の進歩を活用してユーザーに新しいサービスと製品を提供したいと考えており、大規模なテクノロジー企業はRESTful APIを介してこれを可能にします。このようなAPIは、統合が容易なオンデマンドのマシンインテリジェンスを約束しますが、現在の設計、ドキュメント、および開発者インターフェイスは、それらを動かす基礎となる機械学習技術の多くを隠しています。このようなAPIは従来のAPIのように見えますが、データ駆動型の確率的動作を抽象化します-クラウドストレージなどの他の従来のクラウドサービスと同じ方法でこれらのAPIを処理する開発者の影響が懸念されます。この調査の目的は、これらのインテリジェントサービスのうち最も成熟したもの、特にコンピュータービジョンを提供するものに依存するシステムを実装する際に、開発者が直面するさまざまな問題点を特定することです。 Stack Overflowを使用して、コンピュータービジョンサービスを使用するときに開発者が直面する不満の兆候をマイニングし、最近の2つの分類分類（ドキュメント関連の質問と一般的な質問）に対して質問を分類します。モバイル開発のような未熟な分野とは異なり、開発者が尋ねる質問のタイプには対照があることがわかります。これらは、そのようなシステムを強化する基礎技術の浅い理解を示しています。ソフトウェア工学コミュニティがこれらのサービスを改善する方法を提案し、開発者がそれらを使用する性質についてコメントするために、学習分類法のレンズを介してこれらの調査結果のいくつかの意味を議論します。