学習理論分野論文まとめ【2020年01月25日arXiv公開】

アブストまとめ
Like0
お気に入り

2020年01月25日に発表された学習理論分野の論文48本のAbstractをまとめて和訳しました。

この記事の見出し

Deep Transformer Models for Time Series Forecasting: The Influenza Prevalence Case

時系列予測のためのディープトランスフォーマモデル:インフルエンザ有病率のケース

著者:Neo Wu, Bradley Green, Xue Ben, Shawn O’Banion
URL:http://arxiv.org/abs/2001.08317v1

この論文の概要(機械翻訳による和訳)
このホワイトペーパーでは、時系列予測への新しいアプローチを示します。時系列データは、多くの科学および工学分野で普及しています。時系列予測は、時系列データのモデリングにおける重要なタスクであり、機械学習の重要な領域です。この作業では、Transformerベースの機械学習モデルを使用して時系列データを予測する新しい方法を開発しました。このアプローチは、自己注意メカニズムを活用して、時系列データから複雑なパターンとダイナミクスを学習することで機能します。さらに、これは汎用フレームワークであり、単変量および多変量の時系列データ、および時系列の埋め込みに適用できます。ケーススタディとしてインフルエンザ様疾患(ILI)の予測を使用して、我々のアプローチで得られた予測結果は、最先端の技術に匹敵するものであることを示します。

FsNet: Feature Selection Network on High-dimensional Biological Data

FsNet:高次元生物学データの特徴選択ネットワーク

著者:Dinesh Singh, Makoto Yamada
URL:http://arxiv.org/abs/2001.08322v1

この論文の概要(機械翻訳による和訳)
生物学的データは一般に高次元であり、複雑な非線形パターンを発見するために十分に一般化され、スケーラブルな効率的な機械学習方法が必要です。人工知能と機械学習の分野における最近の進歩は、ディープニューラルネットワーク(DNN)に起因する可能性があります。これは、コンピュータービジョンと自然言語処理のさまざまなタスクを達成するためです。ただし、標準のDNNは、高次元のデータや少数のサンプルを含むデータの処理には適していません。これは、多数のパラメーターを学習するために大量の計算リソースと多数のサンプルが必要になるためです。特に、遺伝子発現データなどの高次元の生物学的データには解釈可能性が重要ですが、DNNモデルの非線形特徴選択アルゴリズムは完全には調査されていません。本稿では、スケーラブルなコンクリートニューラルネットワークアーキテクチャであるFeature Selection Network(FsNet)と呼ばれる新しい非線形特徴選択方法を、高次元および少数のサンプル設定で提案します。具体的には、ネットワークは、離散的な特徴選択に具体的なランダム変数を使用するセレクターレイヤーと、再構築損失で正則化された監視されたディープニューラルネットワークで構成されます。セレクターと再構築レイヤーの多数のパラメーターは、限られたサンプル数で簡単にオーバーフィッティングを引き起こす可能性があるため、2つの小さなネットワークを使用して、セレクターと再構築レイヤーの大きな仮想重み行列を予測します。いくつかの実世界の高次元生物学データセットの実験結果は、提案されたアプローチの有効性を示しています。

A Deep Learning Approach to Behavior-Based Learner Modeling

行動ベースの学習者モデリングへの深層学習アプローチ

著者:Yuwei Tu, Weiyu Chen, Christopher G. Brinton
URL:http://arxiv.org/abs/2001.08328v1

この論文の概要(機械翻訳による和訳)
eラーニングの人気の高まりにより、予測分析やコンテンツの推奨などの手法を通じてオンライン教育を改善する必要性が生じています。このホワイトペーパーでは、学習者の結果の予測、つまりコース終了時の学習結果の予測について検討します。学習者がコースをどのように進行するか、コンテンツがコースをどのように進行するかという2つの重要な要素を組み込んだ、パフォーマンス予測のための新しい2つの分岐決定ネットワークを提案します。学習者が学習中に行うすべてのアクションを記録するクリックストリーム機能と、事前にトレーニングされたGloVe単語の埋め込みによって生成されるテキスト機能を組み合わせます。提案されたネットワークのパフォーマンスを評価するために、企業トレーニング用に設計された短いオンラインコースからデータを収集し、ニューラルネットワークと非ニューラルネットワークベースのアルゴリズムの両方を評価します。提案したアルゴリズムは、95.7%の精度と0.958 AUCスコアを達成し、他のすべてのモデルよりも優れています。また、結果は、動作機能とテキスト機能の組み合わせが動作機能のみよりも予測的であり、ニューラルネットワークモデルがユーザーの動作とコースコンテンツ間の結合関係をキャプチャするのに強力であることも示しています。

Applying Recent Innovations from NLP to MOOC Student Course Trajectory Modeling

NLPからMOOC学生コースの軌道モデリングへの最近のイノベーションの適用

著者:Clarence Chen, Zachary Pardos
URL:http://arxiv.org/abs/2001.08333v1

この論文の概要(機械翻訳による和訳)
このペーパーでは、以前にNLP(自然言語処理)タスクに取り組むために適用された複数のアイデアを適用して、MOOC学生コースの軌跡モデリングのニューラルネットワークに基づく予測手法を改善できるいくつかの戦略を提示します。特に、このペーパーでは、最近導入されたTransformerarchitectureとともに、2つの形式の正則化で強化されたLSTMネットワークを調査します。

Target-Embedding Autoencoders for Supervised Representation Learning

教師あり表現学習のためのターゲット埋め込みオートエンコーダ

著者:Daniel Jarrett, Mihaela van der Schaar
URL:http://arxiv.org/abs/2001.08345v1

この論文の概要(機械翻訳による和訳)
オートエンコーダベースの学習は、教師なしおよび半教師付き設定で表現を訓練するための主要なものとして浮上しています。このペーパーでは、ターゲット空間が高次元である、純粋に監視された設定で一般化を改善するためのフレームワークを分析します。教師付き予測のためのターゲット埋め込みオートエンコーダー(TEA)の一般的なフレームワークを動機付け、形式化し、機能から予測可能でもターゲットの予測でもあるように共同で最適化された中間潜在表現を学習します。ターゲットのバリエーションがコンパクトなセットによって駆動される前にエンコードする基礎となる要因。理論上の貢献として、我々は、均一な安定性を実証し、補助再構成タスクの利点を正則化の形として解釈することにより、線形TEAの一般化の保証を提供します。経験的貢献として、このアプローチの検証を既存の静的分類アプリケーションを超えて多変量シーケンス予測に拡張し、線形および非線形リカレントアーキテクチャの両方でそれらの利点を検証します。これにより、フィードフォワードインスタンス化を超えたこのフレームワークのさらなる一般性を強調しています。

Pre-training via Leveraging Assisting Languages and Data Selection for Neural Machine Translation

ニューラル機械翻訳のための支援言語とデータ選択の活用による事前トレーニング

著者:Haiyue Song, Raj Dabre, Zhuoyuan Mao, Fei Cheng, Sadao Kurohashi, Eiichiro Sumita
URL:http://arxiv.org/abs/2001.08353v1

この論文の概要(機械翻訳による和訳)
大きなモノリンガルデータを使用したシーケンス間(S2S)事前トレーニングは、低リソース設定でのさまざまなS2S NLPタスクのパフォーマンスを向上させることが知られていますが、対象の言語(LOI)で大きなモノリンガルコーパスを常に利用できるとは限りません。このために、他の言語の単一言語コーパスを活用して、LOIの単一言語コーパスの不足を補完することを提案します。低リソースの日英ニューラル機械翻訳(NMT)のケーススタディにより、大規模な中国語とフランス語の単一言語コーパスを活用することで、S2S事前トレーニングの日本語と英語の単一言語コーパスの不足を克服できることが明らかになりました。さらに、スクリプトマッピング(中国語から日本語)を使用して2つの単一言語コーパスの類似性を高め、翻訳品質をさらに向上させる方法を示します。さらに、事前トレーニングの前に使用する単純なデータ選択手法を提案します。 S2S事前トレーニング。提案された方法の経験的比較により、支援言語の単一言語コーパス、データ選択、およびスクリプトマッピングの活用は、低リソースシナリオでのNMT事前トレーニングに非常に重要であることがわかります。

BLK-REW: A Unified Block-based DNN Pruning Framework using Reweighted Regularization Method

BLK-REW:Reweighted Regularization Methodを使用した統合ブロックベースのDNNプルーニングフレームワーク

著者:Xiaolong Ma, Zhengang Li, Yifan Gong, Tianyun Zhang, Wei Niu, Zheng Zhan, Pu Zhao, Jian Tang, Xue Lin, Bin Ren, Yanzhi Wang
URL:http://arxiv.org/abs/2001.08357v1

この論文の概要(機械翻訳による和訳)
さまざまなリソースが制限されたコンピューティングプラットフォームでのDNN実行の高速化は、長年の問題でした。先行研究では、l1ベースのグループラッソまたはADMMなどの動的正則化を利用して、DNNモデルで構造化プルーニングを実行し、並列コンピューティングアーキテクチャを活用しています。しかし、枝刈り寸法と枝刈り方法の両方に普遍性が欠けているため、パフォーマンスが低下し、適用性が制限されます。この問題を解決するために、一般的で柔軟な構造化プルーニングディメンションと、強力で効率的な再重み付けされた正則化方法を備えた、新しいブロックベースのプルーニングフレームワークを提案します。私たちのフレームワークは普遍的であり、CNNとRNNの両方に適用でき、2つの主要な計算集約型レイヤー(つまり、CONVレイヤーとFCレイヤー)を完全にサポートすることを意味します。加速のためのプルーニングタスクのすべての側面を完了するために、リアルタイムベースでDNN推論を実行できるフレームワークにコンパイラベースのコード最適化も統合します。私たちの知る限りでは、weightpruningフレームワークが、リアルタイムのモバイルアクセラレーションと精度の妥協なしで、CNNとRNNの両方のユニバーサルカバレッジを達成するのは初めてです。

Scaling Laws for Neural Language Models

神経言語モデルのスケーリング則

著者:Jared Kaplan, Sam McCandlish, Tom Henighan, Tom B. Brown, Benjamin Chess, Rewon Child, Scott Gray, Alec Radford, Jeffrey Wu, Dario Amodei
URL:http://arxiv.org/abs/2001.08361v1

この論文の概要(機械翻訳による和訳)
クロスエントロピー損失に関する言語モデルの性能に関する経験的なスケーリング則を研究します。損失は​​、モデルサイズ、データセットサイズ、およびトレーニングに使用される計算量のべき乗則としてスケーリングし、いくつかの傾向は7桁を超えます。ネットワークの幅や深さなどのその他のアーキテクチャの詳細は、広範囲で最小限の影響しか与えません。 Simpleequationsは、モデル/データセットサイズに対するオーバーフィットの依存性と、モデルサイズに対するトレーニング速度の依存性を管理します。これらの関係により、固定計算予算の最適な割り当てを決定できます。より大きなモデルでは、サンプルの効率が大幅に向上するため、最適な計算効率のトレーニングには、比較的控えめな量のデータで非常に大きなモデルをトレーニングし、収束する前に大幅に停止する必要があります。

Continual Local Replacement for Few-shot Image Recognition

少数ショット画像認識のための継続的なローカル置換

著者:Canyu Le, Zhonggui Chen, Xihan Wei, Biao Wang, Lei Zhang
URL:http://arxiv.org/abs/2001.08366v1

この論文の概要(機械翻訳による和訳)
数発学習の目標は、1つまたは少数のトレーニングデータに基づいて、新規クラスを認識できるモデルを学習することです。主に次の2つの側面により課題があります。(1)新規クラスの優れた特徴表現が不足している。 (2)いくつかのラベル付きデータは、真のデータ分布を正確に表すことができませんでした。この作業では、高度なネットワークアーキテクチャを使用して、より優れた機能表現を学習し、2番目の問題に焦点を当てます。データ不足の問題に対処するために、新しい継続的なローカル交換戦略が提案されています。ラベルのない画像のコンテンツを利用して、ラベルの付いた画像を継続的に強化します。具体的には、擬似ラベリング戦略が採用され、その場でセマンティック類似画像を常に選択します。元のラベル付き画像は、次のエポックトレーニング用に選択した画像にローカルで置き換えられます。このようにして、モデルはラベルのない画像から新しいセマンティック情報を直接学習でき、埋め込みスペース内の監視信号の容量を大幅に拡大できます。これにより、モデルは一般化を改善し、分類のより良い決定境界を学習できます。広範な実験により、当社のアプローチがさまざまな少数ショット画像認識ベンチマークで既存の方法よりも非常に競争力のある結果を達成できることが実証されています。

A Bayesian Long Short-Term Memory Model for Value at Risk and Expected Shortfall Joint Forecasting

バリュー・アット・リスクと予想される不足共同予測のためのベイジアン長期短期記憶モデル

著者:Zhengkun Li, Minh-Ngoc Tran, Chao Wang, Richard Gerlach, Junbin Gao
URL:http://arxiv.org/abs/2001.08374v1

この論文の概要(機械翻訳による和訳)
Value-at-Risk(VaR)およびExpected Shortfall(ES)は、市場リスクを測定し、極端な市場の動きを管理するために、金融セクターで広く使用されています。分位点スコア関数と非対称ラプラス密度の間の最近のリンクは、VaRとESのジョイントモデリングのための柔軟な尤度ベースのフレームワークをもたらしました。これら2つの量の基礎となる共同ダイナミクスをキャプチャできることは、金融アプリケーションで高い関心を集めています。非対称ラプラス準尤度に基づいたハイブリッドモデルを開発し、Machine LearningのLong Short-Term Memory(LSTM)時系列モデリング手法を使用して、VaRおよびESの基礎となるダイナミクスを効率的にキャプチャすることにより、この問題に対処します。このモデルをLSTM-ALと呼びます。 LSTM-ALモデルのベイジアン推論には、適応マルコフ連鎖モンテカルロ(MCMC)アルゴリズムを採用しています。実証結果は、提案されたLSTM-ALモデルが、確立されたさまざまな競合モデルにわたってVaRおよびESの予測精度を改善できることを示しています。

Visual Summary of Value-level Feature Attribution in Prediction Classes with Recurrent Neural Networks

リカレントニューラルネットワークを使用した予測クラスでの値レベルの機能属性の視覚的要約

著者:Chuan Wang, Xumeng Wang, Kwan-Liu Ma
URL:http://arxiv.org/abs/2001.08379v1

この論文の概要(機械翻訳による和訳)
ディープリカレントニューラルネットワーク(RNN)は、時系列での意思決定にますます使用されています。ただし、RNNモデルが最終的な予測をどのように生成するかを理解することは、依然として大きな課題です。シーケンス予測のためのRNNモデルの解釈に関する既存の研究は、多くの場合、個々のデータインスタンス(患者や学生など)の予測の説明に焦点を当てています。最先端の予測モデルは、数百万の最適化されたインスタンスの数百万のパラメーターで形成されているため、単一のデータインスタンスの予測を説明すると、全体像を簡単に見逃してしまいます。その上、多くの優れたRNNモデルは、マルチホットエンコーディングを使用して、機能の属性の解釈が欠落している機能の有無を表します。 ViSFAを紹介します。これは、さまざまな機能の値について、機能の属性を経時的に視覚的に要約する対話型システムです。 ViSFAは、120万の高次元の一時的なイベントの電子健康記録を含むMIMICデータセットなどの大規模データにスケーリングします。複雑な属性をコンパクトで解釈しやすい視覚化に抽出することにより、ViSFAがRNN予測を推論し、データから洞察を発見するのに役立つことを実証します。

Adaptation of a deep learning malignancy model from full-field digital mammography to digital breast tomosynthesis

フルフィールドデジタルマンモグラフィからデジタル乳房トモシンセシスへの深層学習悪性腫瘍モデルの適応

著者:Sadanand Singh, Thomas Paul Matthews, Meet Shah, Brent Mombourquette, Trevor Tsue, Aaron Long, Ranya Almohsen, Stefano Pedemonte, Jason Su
URL:http://arxiv.org/abs/2001.08381v1

この論文の概要(機械翻訳による和訳)
マンモグラフィに基づくスクリーニングは、乳がんの死亡率を低下させるのに役立ちましたが、特異性が低く、不必要な検査や手順、低感度につながる可能性のある有害性にも関連しています。デジタル乳房トモシンセシス(DBT)は、感度と特異性の両方を高めることで従来のマンモグラフィを改善し、臨床現場で一般的になっていますが、ディープラーニング(DL)モデルは、主に従来の2Dフルフィールドデジタルマンモグラフィ(FFDM)またはスキャンされたフィルム画像で開発されました。注釈付きの大きなDBTデータセットが不足しているため、DBTのモデルをゼロからトレーニングすることは困難です。この作業では、FFDMimagesでトレーニングされたモデルをDBTイメージに一般化する方法を示します。特に、平均ヒストグラムマッチング(HM)およびDL微調整手法を使用して、FFDMモデルをDBT画像の2D最大強度投影(MIP)に一般化します。提案されたアプローチでは、FFDMとDBTドメインの違いはHMによって縮小され、その後、豊富なFFDMイメージでトレーニングされたベースモデルが微調整されます。特定された調査結果の周りに抽出されたオンイメージパッチを評価する場合、RODM AUCと比較して、FFDMでは$ sim 0.9 $、MIP画像では$ sim 0.85 $のレシーバー動作特性曲線(ROC AUC)の下で同様の領域を達成できますMIPイメージで直接テストした場合、$ sim 0.75 $。

A Hypersensitive Breast Cancer Detector

過敏性乳がん検出器

著者:Stefano Pedemonte, Brent Mombourquette, Alexis Goh, Trevor Tsue, Aaron Long, Sadanand Singh, Thomas Paul Matthews, Meet Shah, Jason Su
URL:http://arxiv.org/abs/2001.08382v1

この論文の概要(機械翻訳による和訳)
マンモグラフィのスクリーニングによる乳がんの早期発見により、生存率が20〜35%増加します。しかし、マンモグラフィのスクリーニングを求めている女性の人口の増加に対応するのに十分な放射線科医はいません。市販のコンピューター支援検出(CADe)ソフトウェアは何十年も放射線科医に利用されてきましたが、調査結果の範囲に対する感度が低いため、フルフィールドデジタルマンモグラフィ(FFDM)画像の解釈を改善することに失敗しました。この作業では、マンモグラフィ上重要な所見のゆるい境界ボックスを備えた多数のFFDM画像を活用して、極端な感度でディープラーニング検出器をトレーニングします。 Hourglassアーキテクチャからの作業に基づいて、地上空間ボックスを中心とした2Dガウスブロブを生成することを目的として、高空間解像度でセグメンテーションのような画像を生成するモデルをトレーニングします。ピクセル単位の$ L_2 $ノルムを、高感度を達成するために設計された弱監視損失に置き換え、誤検出と誤検出を非対称的にペナルティ化する一方で、不整合な予測の許容範囲を許可することにより、緩やかな境界ボックスのノイズを和らげます。結果として得られるシステムは、悪性の所見に対して0.99の感度を達成し、画像ごとに4.8の偽陽性マーカーしかありません。 CADeシステムで使用すると、このモデルは、放射線科医がモデルによって提案された場所のみに信頼を持って注意を集中し、解釈プロセスを促進し、そうでなければ見逃される可能性のある発見に注意を向けることができる新しいワークフローを可能にすることができます。ほぼ完全な感度のため、提案されている検出器は、2段階検出システムの高性能提案ジェネレーターとしても使用できます。

Towards Robust DNNs: An Taylor Expansion-Based Method for Generating Powerful Adversarial Examples

ロバストなDNNに向けて:強力な敵対的な例を生成するためのテイラー展開ベースの方法

著者:Ya-guan Qian, Xi-Ming Zhang, Bin Wang, Wei Li, Jian-Hai Chen, Wu-Jie Zhou, Jing-Sheng Lei
URL:http://arxiv.org/abs/2001.08389v1

この論文の概要(機械翻訳による和訳)
ディープニューラルネットワーク(DNN)は多くの分野で成功したアプリケーションを実現していますが、敵対的な例に対して脆弱です。敵対的訓練は、DNNの堅牢性を改善する最も効果的な方法の1つであり、損失関数を最小化し、摂動を最大化するミニマックスポイント問題として一般に考えられています。したがって、強力な敵対者の例は、摂動の最大化を効果的にシミュレートして、ミニマックス問題を解決できます。論文では、ロバストな敵訓練のためのより強力な敵の例を生成するための新しい方法が提案されました。主なアイデアは、Taylor展開を使用して入力近傍のDNNの出力を近似し、ラグランジュ乗数法を使用して敵の例を生成することで最適化します。実験結果は、これらの強力な敵対者の例で訓練されたDNNの堅牢性を効果的に改善できることを示しています。

A One-Shot Learning Framework for Assessment of Fibrillar Collagen from Second Harmonic Generation Images of an Infarcted Myocardium

梗塞心筋の第二高調波発生画像からの線維性コラーゲンの評価のためのワンショット学習フレームワーク

著者:Qun Liu, Supratik Mukhopadhyay, Maria Ximena Bastidas Rodriguez, Xing Fu, Sushant Sahu, David Burk, Manas Gartia
URL:http://arxiv.org/abs/2001.08395v1

この論文の概要(機械翻訳による和訳)
心筋梗塞(MI)は、心臓発作を指す科学用語です。この研究では、梗塞マウスの心臓における2光子励起細胞自家蛍光とともに高度に非中心対称のアセンブリを示すコラーゲン繊維から、関連性の高い第2高調波発生(SHG)キューを推測します特にMI後の初期段階を対象とする線維症をプローブします。MI後のスペクトル特異性と感度を備えた心臓組織の構造的配置とともに、高空間分解能でコラーゲンの2Dアセンブリの決定を可能にする堅牢なワンショット機械学習アルゴリズムを提供します。初期段階での線維症の程度の検出、評価、および正確な定量化は、さらなる進行を防ぎ、患者の生存のための心臓移植の必要性を判断する治療法の開発を導くでしょう。

Stacked Boosters Network Architecture for Short Term Load Forecasting in Buildings

建物の短期負荷予測のためのスタック型ブースターネットワークアーキテクチャ

著者:Tuukka Salmi, Jussi Kiljander, Daniel Pakkala
URL:http://arxiv.org/abs/2001.08406v1

この論文の概要(機械翻訳による和訳)
このホワイトペーパーでは、建物のエネルギー負荷の短期的な負荷予測のための新しい深層学習アーキテクチャを示します。このアーキテクチャは、単一の深層ネットワークとしてモデル化されたシンプルベース学習器と複数のブースティングシステムに基づいています。このアーキテクチャは、元の多変量時系列を複数のカスケード単変量時系列に変換します。疎相互作用、パラメータ共有、および同変表現を組み合わせることで、このアプローチにより、深いネットワークアーキテクチャで優れた表現力を実現しながら、過剰適合との戦いが可能になります。アーキテクチャは、フィンランドのオフィスビルからのエネルギーデータを使用して、いくつかの短期負荷予測タスクで評価されます。提案されたアーキテクチャは、すべてのタスクで最先端の負荷予測モデルよりも優れています。

Linking Bank Clients using Graph Neural Networks Powered by Rich Transactional Data

豊富なトランザクションデータを活用したグラフニューラルネットワークを使用した銀行クライアントのリンク

著者:Valentina Shumovskaia, Kirill Fedyanin, Ivan Sukharev, Dmitry Berestnev, Maxim Panov
URL:http://arxiv.org/abs/2001.08427v1

この論文の概要(機械翻訳による和訳)
金融機関は、ユーザートランザクションと送金に関する膨大な量のデータを取得します。これは、時間とともに動的に変化する大きなグラフと考えることができます。この作業では、銀行のクライアントのネットワークにおける新しい相互作用を予測するタスクに焦点を当て、リンク予測の問題として扱います。ネットワークのトポロジ構造だけでなく、グラフのノードとエッジに使用できる豊富な時系列データを使用する新しいグラフニューラルネットワークモデルを提案します。欧州の大手銀行から数年間提供されたデータを使用して、開発した方法を評価します。提案されたモデルは、他のニューラルネットワークモデルを含む既存のアプローチよりも優れており、リンク予測問題のROC AUCスコアに大きなギャップがあり、クレジットスコアリングの品質を向上させることもできます。

Fast, Compact and Highly Scalable Visual Place Recognition through Sequence-based Matching of Overloaded Representations

オーバーロードされた表現のシーケンスベースのマッチングによる、高速でコンパクトで拡張性の高い視覚的な場所認識

著者:Sourav Garg, Michael Milford
URL:http://arxiv.org/abs/2001.08434v1

この論文の概要(機械翻訳による和訳)
視覚的な場所認識アルゴリズムは、ストレージフットプリント、計算要件、および結果として生じるパフォーマンスの3つの重要な特性をトレードオフします。これらはしばしばリコール率で表されます。重要な先行研究では、非常にコンパクトな場所表現、準線形計算スケーリング、および準線形ストレージスケーリング技術が調査されましたが、これらの点の1つ以上で常に重大な妥協が行われ、比較的小さなデータセットでのみ実証されています。この論文では、超コンパクトな場所表現、準線形ストレージのスケーリング、および非常に軽量な計算要件の組み合わせを初めて可能にする、新しい場所認識システムを紹介します。私たちのアプローチは、ロボティクスドメインの多くの空間データの本質的にシーケンシャルな性質を活用し、より多くの衝突につながるが、シーケンスベースのマッチングによって解決される意図的に粗いスカラー量子化ベースのハッシングを通じて、典型的なターゲット基準を逆にします。初めて、非常に大きな新しい1,000万個の場所のデータセットで効果的な場所認識率を達成できることを示します。場所ごとに8バイトのストレージと37Kの単一操作が必要で、100フレームのシーケンスと一致する50%以上のリコールを実現します。従来の最先端のアプローチは、1300倍の計算を消費し、破局的に失敗します。さまざまなサイズの量子化ベクトル長の下でのハッシュオーバーロードアプローチの有効性を調査する分析を提示し、ニアミスマッチと実際のマッチ選択との比較を行い、量子化に対するデータの分散再スケーリングの影響を特徴付けます。

Multi-objective Neural Architecture Search via Non-stationary Policy Gradient

非定常ポリシー勾配による多目的ニューラルアーキテクチャ検索

著者:Zewei Chen, Fengwei Zhou, George Trimponias, Zhenguo Li
URL:http://arxiv.org/abs/2001.08437v1

この論文の概要(機械翻訳による和訳)
多目的ニューラルアーキテクチャ検索(NAS)は、複数の相反する目的が存在する中で新しいアーキテクチャを発見することを目的としています。スカラー化と進化に基づく最近のアプローチは有望な結果をもたらしましたが、完全なパレートフロントを正確かつ効率的に近似する問題は挑戦的なままです。この目的のために、本研究では、非定常政策勾配(NPG)の新規強化学習ベースのパラダイムを検討します。NPGは非定常報酬関数を利用し、パレートフロント全体を効率的にキャプチャするための政策の継続的適応を促進します。スカラー化と進化からの要素を持つ2つの新しい報酬関数を紹介します。非定常性を処理するために、コサインの温度減衰とウォームリスタートを使用した新しい探査スキームを提案します。迅速かつ正確なアーキテクチャ評価のために、トレーニング中に継続的に微調整する、事前トレーニング済みの新しい共有モデルを導入します。 CIFAR-10、CIFAR-100、およびImageNetに関する広範な実験的研究は、フレームワークが代表的なパレートフロントを高速で発見しながら、他の多目的NASメソッドおよび多くの最先端のNASメソッドよりも優れた予測パフォーマンスを達成できることを示しています同様のネットワークサイズ。私たちの研究は、NPGが多目的NASのシンプルで高速かつ効果的なパラダイムとしての可能性を示しています。

On the human evaluation of audio adversarial examples

オーディオ敵対例の人間評価について

著者:Jon Vadillo, Roberto Santana
URL:http://arxiv.org/abs/2001.08444v1

この論文の概要(機械翻訳による和訳)
人間と機械の相互作用は音声通信にますます依存するようになっていますが、通常、機械学習モデルは人間の音声コマンドの解釈に適用されますが、これらのモデルは敵の例にだまされる可能性があります。敵対的摂動を生成する新しい手法の開発に焦点が当てられており、人間が摂動に気付くかどうか、およびどのように気付くかを決定する側面への注意はあまり払われていません。提案された敵対摂動戦略の高いだまし率は摂動が検出できない場合にのみ価値があるため、この質問は重要です。この論文では、オーディオの敵対的な例に関する文献で提案されている歪み測定基準が、これらの攻撃を生成する方法の有効性を評価するために一般的に適用される範囲で、摂動に対する人間の知覚の信頼できる尺度であるかどうかを調査します。また、18人の被験者が音声の敵の例を評価する実験では、従来の方法で採用されたメトリックが、音声の領域における敵の例の知覚的類似性の信頼できる尺度ではないことを示しています。

Low-Complexity LSTM Training and Inference with FloatSD8 Weight Representation

FloatSD8重量表現による低複雑度のLSTMトレーニングと推論

著者:Yu-Tung Liu, Tzi-Dar Chiueh
URL:http://arxiv.org/abs/2001.08450v1

この論文の概要(機械翻訳による和訳)
FloatSDテクノロジーは、複雑性の低い畳み込みニューラルネットワーク(CNN)のトレーニングと推論で優れたパフォーマンスを発揮することが示されています。この論文では、FloatSDをリカレントニューラルネットワーク(RNN)、特に長期短期記憶(LSTM)に適用しました。 FloatSD weightrepresentationに加えて、モデルトレーニングの勾配とアクティベーションを8ビットに量子化しました。さらに、累積の計算精度と重みのマスターコピーが32ビットから16ビットに低下しました。モデルの精度を完全に維持しながら、提案されたトレーニングスキームが複数のLSTMモデルをゼロから正常にトレーニングできることを実証しました。最後に、実装における提案方法の利点を検証するために、LSTMニューロン回路を設計し、ダイ面積と消費電力を大幅に削減できることを示しました。

Ada-LISTA: Learned Solvers Adaptive to Varying Models

Ada-LISTA:さまざまなモデルに適応する学習済みソルバー

著者:Aviad Aberdam, Alona Golts, Michael Elad
URL:http://arxiv.org/abs/2001.08456v1

この論文の概要(機械翻訳による和訳)
LISTA(学習反復ソフトしきい値アルゴリズム)などの反復ソルバーの展開に基づくニューラルネットワークは、パフォーマンスが向上するため広く使用されています。それにもかかわらず、非学習ソルバーとは対照的に、これらのネットワークは特定の辞書でトレーニングされるため、さまざまなモデルシナリオには適用できません。この作業では、Ada-LISTAと呼ばれる適応学習ソルバーを紹介します。Ada-LISTAは、信号のペアとそれに対応する辞書を入力として受け取り、すべてに役立つユニバーサルアーキテクチャを学習します。このスキームは、辞書の摂動や置換を含むさまざまなモデルの線形レートでのスパースコーディングを解決することが保証されていることを証明します。また、その実用的な適応能力を示す広範な数値研究も提供しています。最後に、Ada-LISTAをnaturalimage inpaintingに展開します。パッチマスクは空間的に変化するため、そのような適応が必要です。

Semi-supervised Grasp Detection by Representation Learning in a Vector Quantized Latent Space

ベクトル量子化潜在空間における表現学習による半教師付き把握検出

著者:Mridul Mahajan, Tryambak Bhattacharjee, Arya Krishnan, Priya Shukla, G C Nandi
URL:http://arxiv.org/abs/2001.08477v1

この論文の概要(機械翻訳による和訳)
画像から品質の把握を決定することは、重要な研究分野です。この作業では、ベクトル量子化VariationAutoencoder(VQ-VAE)を使用して離散潜在空間をモデル化する、半教師あり学習ベースの把握検出アプローチを提示します。私たちの知る限り、これはロボットの把持検出の分野でVAEsが適用された最初の例です。 VAEは、ラベル付きデータの量が限られているにもかかわらず、モデルがCornell Grasping Dataset(CGD)を超えて一般化するのに役立ちます。私たちは、CGDにないイメージ上のモデルをテストすることにより、この主張を検証します。また、モデルは、ラベルのない画像を使用して把握を改善しない既存のアプローチよりも大幅に優れたパフォーマンスを発揮します。

A Large Scale Event-based Detection Dataset for Automotive

自動車用の大規模なイベントベースの検出データセット

著者:Pierre de Tournemire. Davide Nitti, Etienne Perot, Davide Migliore, Amos Sironi
URL:http://arxiv.org/abs/2001.08499v1

この論文の概要(機械翻訳による和訳)
イベントカメラ用の最初の非常に大きな検出データセットを紹介します。データセットは、304×240 ATISセンサーで取得された39時間を超える自動車録画で構成されています。都市、高速道路、郊外、田舎の風景から、さまざまな天候や照明条件に至るまで、オープンロードと非常に多様な運転シナリオが含まれています。記録に含まれる車と歩行者の手動境界ボックス注釈も1〜4Hzの周波数で提供され、合計で255,000を超えるラベルが生成されます。このサイズのラベル付きデータセットの可用性は、オブジェクト検出や分類などのイベントベースのビジョンタスクの大きな進歩に貢献すると考えています。また、オプティカルフロー、運動からの構造、追跡など、他のタスクにもメリットが期待されます。たとえば、自己監視型学習方法によって大量のデータを活用できます。

Best Principal Submatrix Selection for the Maximum Entropy Sampling Problem: Scalable Algorithms and Performance Guarantees

最大エントロピーサンプリング問題のための最良の主要部分行列の選択:スケーラブルなアルゴリズムと性能保証

著者:Yongchun Li, Weijun Xie
URL:http://arxiv.org/abs/2001.08537v1

この論文の概要(機械翻訳による和訳)
この論文は、共分散行列から事前に指定されたサイズの最も有益な主要部分行列を選択する古典的な最大エントロピーサンプリング問題(MESP)を研究しています。 MESPは、ヘルスケア、電力システム、製造、データサイエンスなど、多くの分野に広く適用されています。ラグランジュの双対および主な特性を調べることにより、MESPの新しい凸整数プログラムを導出し、その連続緩和によりほぼ最適な解が得られることを示します。この結果は、効率的なサンプリングアルゴリズムを研究し、MESPの近似限界を開発する動機付けとなります。次に、同じ近似限界を持つサンプリングアルゴリズムの効率的な決定論的実装を提供します。特異行列用の新しい数学ツールを開発し、提案された凸整数プログラムのラグランジュ双対を分析することにより、広く使用されているlocalsearchアルゴリズムを調査し、MESPの最初の知られている近似限界を証明します。 Theproofテクニックは、ローカル検索アルゴリズムの効率的な実装で私たちをさらに刺激します。私たちの数値実験は、これらの近似アルゴリズムが中規模および大規模のインスタンスをほぼ最適に効率的に解決できることを示しています。提案されたアルゴリズムは、オープンソースソフトウェアとしてコーディングおよびリリースされています。最後に、分析をA-Optimal MESP(A-MESP)に拡張します。目的は、選択した主部分行列の逆のトレースを最小化することです。

Information Compensation for Deep Conditional Generative Networks

深い条件付き生成ネットワークの情報補償

著者:Zehao Wang, Kaili Wang, Tinne Tuytelaars, Jose Oramas
URL:http://arxiv.org/abs/2001.08559v1

この論文の概要(機械翻訳による和訳)
近年、監視なし/弱監視の条件付き生成的敵対ネットワーク(GAN)は、データのモデル化と生成のタスクで多くの成功を収めています。しかし、それらの弱点の1つは、潜在空間にエンコードされた表現を特徴付けるさまざまな要因を分離または解きほぐす能力の低さにあります。この問題に対処するために、新しい情報補償接続(IC接続)を使用した監視なしの条件付きGANの新しい構造を提案します。提案されたIC接続により、GANはデコンボリューション操作中に発生した情報損失を補償できます。さらに、離散および連続潜在変数のもつれの程度を定量化するために、新しい評価手順を設計します。私たちの経験的な結果は、我々の方法が無条件の世代設定での最新のGANと比較してより良いもつれを解くことを示唆します。

Observer variation-aware medical image segmentation by combining deep learning and surrogate-assisted genetic algorithms

深層学習と代理支援の遺伝的アルゴリズムを組み合わせたオブザーバーバリエーション認識医療画像セグメンテーション

著者:Arkadiy Dushatskiy, Adriënne M. Mendrik, Peter A. N. Bosman, Tanja Alderliesten
URL:http://arxiv.org/abs/2001.08552v1

この論文の概要(機械翻訳による和訳)
最近、深層学習アルゴリズムを使用した医療画像の自動セグメンテーションに大きな進歩がありました。ほとんどの作品では、オブザーバーの変動はトレーニングデータを異質にするため問題であると認められていますが、この変動を明示的に捕捉する試みはこれまでのところ行われていません。ここでは、さまざまなスタイルのセグメンテーションを模倣できるアプローチを提案します。これにより、潜在的に自動セグメンテーション手法の品質と臨床的受容性を向上させることができます。この作業では、利用可能なすべてのデータで1つのニューラルネットワークをトレーニングする代わりに、異なるセグメンテーションバリエーションに属するデータのサブグループでいくつかのニューラルネットワークを個別にトレーニングします。先験的には、データにどのセグメンテーションのスタイルが存在するのかが不明確である可能性があり、異なるスタイルは必ずしも一対一の異なるオブザーバーにマッピングされるとは限らないため、サブグループは自動的に決定される必要があります。これを実現するには、遺伝的アルゴリズムを使用して最適なデータパーティションを検索します。したがって、各ネットワークは、グループ化されたトレーニングデータから特定のセグメンテーションスタイルを学習できます。観察者の変動をシミュレートしたオープンソースの前立腺セグメンテーションMRIデータの原理結果の証明を提供します。このアプローチでは、すべてのデータでトレーニングされた1つのネットワークと比較して、サイコロと表面のダイス係数の面で最大23%(シミュレートされた変動に応じて)向上します。

Sensor-based Continuous Authentication of Smartphones’ Users Using Behavioral Biometrics: A Survey

行動バイオメトリクスを使用したスマートフォンユーザーのセンサーベースの連続認証:調査

著者:Mohammed Abuhamad, Ahmed Abusnaina, DaeHun Nyang, David Mohaisen
URL:http://arxiv.org/abs/2001.08578v1

この論文の概要(機械翻訳による和訳)
モバイルデバイスとテクノロジーはますます人気が高まっており、デスクトップコンピューターに匹敵するストレージと計算機能を提供し、ユーザーが機密情報を保存してやり取りできるようにしています。このような個人情報のセキュリティと保護は、モバイルデバイスが不正アクセスや盗難に対して脆弱であるため、ますます重要になっています。ユーザー認証は最も重要なタスクであり、エントリポイントで使用セッションを通じて継続的に正規ユーザーにアクセスを許可します。このタスクは、行動のバイオメトリックスと特性をキャプチャすることにより、継続的かつ暗黙的なユーザー認証を可能にする今日のスマートフォンの組み込みセンサーで可能になります。このペーパーでは、モーションベースの方法(27の研究)、歩行ベースの方法(23の研究)、キーストロークダイナミクスベースの方法(20の研究)、タッチジェスチャベースを含む、継続的なユーザー認証のための140を超える最近の行動バイオメトリックベースのアプローチを調査します方法(29の研究)、音声ベースの方法(16の研究)、およびマルチモーダルベースの方法(33の研究)。この調査は、スマートフォンによってキャプチャされた行動バイオメトリクスを使用した継続的なユーザー認証のための現在の最先端のアプローチの概要を提供します。採用、使いやすさ、パフォーマンスに関する洞察と未解決の課題を含む組み込みセンサー。

RPN: A Residual Pooling Network for Efficient Federated Learning

RPN:効率的な連合学習のための残余プーリングネットワーク

著者:Anbu Huang, Yuanyuan Chen, Yang Liu, Tianjian Chen, Qiang Yang
URL:http://arxiv.org/abs/2001.08600v1

この論文の概要(機械翻訳による和訳)
フェデレーテッドラーニングとは、データプライバシーとセキュリティを保護しながら、さまざまな関係者が共同でモデルをトレーニングできる新しい機械学習フレームワークです。モデルの複雑さ、ネットワークの信頼性の低さ、および接続の不安定性により、通信コストは、連合学習を実際のアプリケーションに適用するための大きなボトルネックになっています。現在の既存の戦略は、ハイパーパラメータを手動で設定するか、元のプロセスを複数のステップに分割する必要があるため、エンドツーエンドの実装を実現するのが困難です。この論文では、Residual Pooling Network(RPN)と呼ばれる新しい圧縮戦略を提案します。私たちの実験は、RPNがデータ送信を効果的に削減するだけでなく、標準的な連合学習と比較してほぼ同じパフォーマンスを達成することを示しています。新しいアプローチはエンドツーエンドの手順として実行され、通信効率を改善するためにすべてのCNNベースのモデルトレーニングシナリオに容易に適用する必要があります。

Learning Distributional Programs for Relational Autocompletion

リレーショナルオートコンプリートの分布プログラムの学習

著者:Kumar Nitesh, Kuzelka Ondrej, De Raedt Luc
URL:http://arxiv.org/abs/2001.08603v1

この論文の概要(機械翻訳による和訳)
リレーショナルオートコンプリートは、リレーショナルデータベースの欠落しているフィールドに自動的に入力する問題です。離散および連続確率分布の両方をサポートする分布節(DC)の確率論的論理プログラミングフレームワーク内でこの問題に取り組みます。このフレームワーク内で、Dreamlを紹介します。これは、欠落している情報を含む可能性のあるデータベースからDCプログラムの構造とパラメーターの両方を学習するアプローチです。これを実現するために、Dreamlは統計モデリング、分布節、ルール学習を統合しています。 Dreamlの際立った特徴は、1)リレーショナルオートコンプリートに取り組む、2)統計モデルで拡張された分布句を学習する、3)離散分布と連続分布の両方に対処する、4)バックグラウンドの知識を活用できる、5)期待値最大化ベースのアルゴリズムを使用して対処することです欠損データ。

Variational Hierarchical Dialog Autoencoder for Dialogue State Tracking Data Augmentation

対話状態追跡データ増強のための変分階層ダイアログ自動エンコーダ

著者:Kang Min Yoo, Hanbit Lee, Franck Dernoncourt, Trung Bui, Walter Chang, Sang-goo Lee
URL:http://arxiv.org/abs/2001.08604v1

この論文の概要(機械翻訳による和訳)
最近の研究は、深い生成モデルから生成された合成サンプルを使用してトレーニングデータセットを増強する生成データ増強が、特定のNLPタスクに役立つことを示しています。この作業では、このアプローチを、目標指向の対話の対話状態追跡のタスクに拡張します。この場合、データは、発話や関連する注釈よりも階層構造を自然に示します。対話状態追跡のための深い生成データの増強には、生成モデルが階層構造データを認識する必要があります。言語的および基本的な注釈構造を含む、目標指向の対話のさまざまな側面をモデル化するために、変分階層型ダイアログオートエンコーダ(VHDA)を提案します。私たちの実験は、私たちのモデルが最先端の対話状態トラッカーの堅牢性を改善し、最終的にいくつかのデータセットの最終ダイアログ状態追跡パフォーマンスを改善する現実的で斬新なサンプルを生成できることを示しています。

Compositional properties of emergent languages in deep learning

深層学習における新興言語の構成的特性

著者:Bence Keresztury, Elia Bruni
URL:http://arxiv.org/abs/2001.08618v1

この論文の概要(機械翻訳による和訳)
マルチエージェントの深層学習システムにおける最近の発見は、構成言語の出現を指し示しています。これらの主張は、多くの場合、正確な分析や言語のテストなしで行われます。この作業では、2つの異なる協調型マルチエージェントゲームから生じる緊急言語を分析し、より正確な構成を測定します。私たちの調査結果は、ディープラーニングモデルによって発見されたソリューションは、しばしば抽象レベルで推論する能力に欠けているため、学習した知識をトレーニングの分布例から一般化できないことを示唆しています。組成能力をテストするための戦略と人間レベルの概念の出現について説明します。

Intelligent Chest X-ray Worklist Prioritization by CNNs: A Clinical Workflow Simulation

CNNによるインテリジェントな胸部X線ワークリストの優先順位付け:臨床ワークフローシミュレーション

著者:Ivo M. Baltruschat, Leonhard Steinmeister, Hannes Nickisch, Axel Saalbach, Michael Grass, Gerhard Adam, Harald Ittrich, Tobias Knopp
URL:http://arxiv.org/abs/2001.08625v1

この論文の概要(機械翻訳による和訳)
放射線の仕事量の増加と世界中の医療専門家の不足は、しばしば検査の遅延または未報告につながり、胸部X線写真(CXR)で認識されない所見があった場合、患者の安全にリスクをもたらすことがあります。放射線ワークフローを最適化し、FIFO(First-In-First-Out-Principle)に準拠したレポートの代わりに、重要な所見のレポートターンアラウンドタイム(RTAT)を短縮できます。さらに、ワークリストの優先順位付けのコンテキストでの偽陰性予測の問題を調査しました。インテリジェントなワークリストの優先順位付けの潜在的な利点を評価するために、分析に基づいた3つの異なるワークフローシミュレーションを実行し、RTATを比較しました:FIFO(優先順位なし)、Prio1(優先順位付け)、およびPrio2(RTATmaxで優先順位付け)。検査トリアージは、「気胸、胸水、浸潤、うっ血、無気肺、心肥大、腫瘤、異物」の降順でランク付けされた8つの異なる病理学的所見を分類する畳み込みニューラルネットワーク「ChestXCheck」によって実行されました。すべての重要な調査結果の平均RTATは、FIFOシミュレーションと比較して両方のPrioシミュレーションによって大幅に減少しました(例:気胸:32.1分vs 69.7分; p <0.0001)、通常検査の平均RTATは同時に増加しました(69.5分vs. 90.0分; p <0.0001)。両方の効果は、Prio2でatPrio1よりわずかに低かったが、Prio1での最大RTATは、偽陰性と評価された個々の検査により、すべてのクラスで実質的に高かった。 FIFOと同様の最大RTATを維持しながら、raywhile。

A Study of the Tasks and Models in Machine Reading Comprehension

機械読解におけるタスクとモデルの研究

著者:Chao Wang
URL:http://arxiv.org/abs/2001.08635v1

この論文の概要(機械翻訳による和訳)
Machine ReadingComprehension(MRC)の既存のタスクとモデルに関する調査を提供するために、このレポートでは次のことをレビューします。 2)ニューラルネットワークベースのMRCモデルを開発するためのアーキテクチャ設計、アテンションメカニズム、およびパフォーマンス向上アプローチ。 3)外部コーパスに含まれるテキスト形式の知識をMRCモデルのニューラルネットワークに組み込むための、最近提案された転送学習アプローチ。 4)外部の知識ベースに含まれるグラフ形式の知識をMRCモデルのニューラルネットワークに組み込むための、最近提案されたいくつかの知識ベースエンコーディングアプローチ。その上、達成されたものとまだ不足しているものによると、このレポートは将来の研究のためのいくつかの未解決の問題も提案しています。

Structured Compression and Sharing of Representational Space for Continual Learning

継続的学習のための表現空間の構造化圧縮と共有

著者:Gobinda Saha, Isha Garg, Aayush Ankit, Kaushik Roy
URL:http://arxiv.org/abs/2001.08650v1

この論文の概要(機械翻訳による和訳)
人間は生涯を通じて適応的かつ効率的に学習することに長けていますが、学習タスクにより、人工ニューラルネットワークは古いタスクについて学習した関連情報を徐々に上書きし、「壊滅的な忘却」をもたらします。この現象を克服するための努力は、古いデータやパラメータの重要度スコアを保存したり、ネットワークアーキテクチャを拡大したりする必要があるなど、さまざまな方法でリソースの利用率が低下します。表現空間を、以前に学習したタスクからの凝縮された情報を含むコア空間と、現在のタスクを学習するためのスクラッチ空間に似た残余空間に分割することにより、ネットワークが継続的かつ効率的に学習できるようにするアルゴリズムを提案します。その後、PrincipalComponent Analysisを使用して残余スペースが圧縮され、コアスペースに追加され、次のタスクのパラメーターが解放されます。 P-MNIST、CIFAR-10、CIFAR-100データセットでアルゴリズムを評価します。壊滅的な忘却の問題を完全に克服しながら、最先端の方法に匹敵する精度を達成します。さらに、結果のアーキテクチャの構造化された性質により、推論中のエネルギー効率が最大4.5倍向上します。

Best Arm Identification for Cascading Bandits in the Fixed Confidence Setting

固定信頼度設定での盗賊のカスケードに最適な腕の識別

著者:Zixin Zhong, Wang Chi Cheung, Vincent Y. F. Tan
URL:http://arxiv.org/abs/2001.08655v1

この論文の概要(機械翻訳による和訳)
カスケードバンディットのフレームワーク内で、アームとも呼ばれる$ K $アイテムの最適なセットを見つけるためのアルゴリズムであるCascadeBAIを設計および分析します。 CascadeBAIの時間の複雑さの上限は、重要な分析上の課題、つまり、各ステップで利用可能なフィードバックの量を確率的に推定するという課題を克服することによって導き出されます。これを行うために、左側のサブガウスrvと呼ぶランダム変数(rv)の新しいクラスを定義します。これらは、非累積型の場合に限り、累積生成関数(CGF)がaquadraticによって制限されるrvです。 -CGFの正の引数。これにより、十分にタイトなバーンスタイン型濃度不等式の適用が可能になります。時間の複雑さの下限を導出することにより、CascadeBAIのパフォーマンスがいくつかの実用的なレジームで最適であることを示しています。最後に、広範な数値シミュレーションにより、CascadeBAIの有効性と、時間の複雑さの上限が厳しくなることが裏付けられています。

I Feel I Feel You: A Theory of Mind Experiment in Games

I Feel I Feel You:ゲームにおける心の実験の理論

著者:David Melhart, Georgios N. Yannakakis, Antonios Liapis
URL:http://arxiv.org/abs/2001.08656v1

この論文の概要(機械翻訳による和訳)
ゲームプレイエージェントのプレイヤーの心の感情理論に関するこの研究では、エージェントの行動とプレイヤー自身のパフォーマンスと感情がフラストレーションのある行動の認識をどのように形成するかを調査します。欲求不満は人間とコンピューターの相互作用における一般的な感情的経験であるため、フラストレーションの知覚に焦点を当てています。この目的に合わせて調整されたテストベッドゲームを紹介します。プレイヤーは、理論に基づいたフラストレーションモデルでエージェントと競合します。ゲームプレイデータ、エージェントのフラストレーションに対するプレーヤーの評価に関する注釈付きの真実、および顔認識を適用してプレーヤーの感情状態を推定します。相関分析と予測機械学習モデルを介して収集されたデータを調べ、プレーヤーの観察可能な感情は、エージェントの知覚されたフラストレーションとはあまり相関していないことがわかります。これは、被験者の心の理論がゲームプレイのコンテキストに基づいた認知プロセスであることを示唆しています。

The INTERSPEECH 2020 Deep Noise Suppression Challenge: Datasets, Subjective Speech Quality and Testing Framework

INTERSPEECH 2020ディープノイズ抑制の課題:データセット、主観的な音声品質、およびテストフレームワーク

著者:Chandan K. A. Reddy, Ebrahim Beyrami, Harishchandra Dubey, Vishak Gopal, Roger Cheng, Ross Cutler, Sergiy Matusevych, Robert Aichner, Ashkan Aazami, Sebastian Braun, Puneet Rana, Sriram Srinivasan, Johannes Gehrke
URL:http://arxiv.org/abs/2001.08662v1

この論文の概要(機械翻訳による和訳)
INTERSPEECH 2020 Deep Noise Suppression Challengeは、強化された音声の主観的(知覚)品質を最大化することを目的とした、リアルタイムの単一チャネル音声強化の共同研究を促進することを目的としています。ノイズ抑制方法を評価するための典型的なアプローチは、元のデータセットを分割して得られたテストセットで客観的なメトリックを使用することです。多くの出版物は、トレーニングセットと同じ分布から得られた合成テストセットの合理的なパフォーマンスを報告しています。ただし、実際の録音ではモデルのパフォーマンスが大幅に低下することがよくあります。また、従来の客観的測定基準のほとんどは主観的テストとうまく相関せず、実験室的主観的テストは大規模なテストセットに対してスケーラブルではありません。この課題では、ノイズ抑制モデルをトレーニングするための大規模でクリーンな音声コーパスとノイズコーパス、および合成録音と実際の録音の両方で構成される実際のシナリオに対応する代表的なテストセットをオープンソース化します。また、研究者が開発を迅速にテストできるように、ITU-T P.808に基づくオンライン主観テストフレームワークをオープンソース化します。このチャレンジの勝者は、P.808フレームワークを使用した代表的なテストセットでの主観的評価に基づいて選択されます。

Action Recognition and State Change Prediction in a Recipe Understanding Task Using a Lightweight Neural Network Model

軽量ニューラルネットワークモデルを使用したレシピ理解タスクにおけるアクション認識と状態変化予測

著者:Qing Wan, Yoonsuck Choe
URL:http://arxiv.org/abs/2001.08665v1

この論文の概要(機械翻訳による和訳)
フードレシピの特定のステップを説明する自然言語文を考えてください。そのような指示では、アクション(プレス、ベークなど)とその結果生じる材料の状態の変化(成形、カスタードの調理、高温など)を認識することは困難な作業です。この課題に対処する1つの方法は、エンティティにアクションを適用し、結果を予測するシミュレータモジュールを明示的にモデル化することです(Bosselut et al。2018)が、このようなモデルは不必要に複雑になる可能性があります。本論文では、アクション認識と状態変化予測を分離し、新しい損失関数を介して両者を結合する簡略化されたニューラルネットワークモデルを提案します。これにより、相互に間接的に影響を与えることができます。私たちのモデルは単純ですが、より高い状態変化予測パフォーマンスを達成し(ボッセルトら2018年の55%に対して55%の平均精度)、トレーニングするサンプル数が少なくなります(ボッセルトら2018年までに10万人対65K +) 。

Towards Automatic Clustering Analysis using Traces of Information Gain: The InfoGuide Method

情報ゲインのトレースを使用した自動クラスタリング分析に向けて:InfoGuideメソッド

著者:Paulo Rocha, Diego Pinheiro, Martin Cadeiras, Carmelo Bastos-Filho
URL:http://arxiv.org/abs/2001.08677v1

この論文の概要(機械翻訳による和訳)
クラスタリング分析は、広範囲のドメインで遍在する情報検索ツールになっていますが、より自動化されたフレームワークはまだありません。内部メトリクスはクラスタの検索を成功させるための重要なプレーヤーですが、実際のデータセットに対するそれらの有効性は、主にデータセットの基礎となる非現実的な仮定のため、完全には理解されていません。複雑化するクラスタリング検索間の{ itトレース情報の取得}をキャプチャすることを仮定しました— { it InfoGuide} —自動クラスタリング分析とクラスタリング検索を改善しました。 Kolmogorov-Smirnov統計を使用して情報ゲインのトレースをキャプチャし、{ it InfoGuide}によって取得されたクラスターを、人工的に生成されたベンチマーク、および実世界のデータセットで一般的に使用される他の内部メトリックによって取得されたクラスターと比較することにより、{ it InfoGuide}仮説を検証しました。我々の結果は、{ it InfoGuide}がより自動化されたクラスタリング分析を可能にし、重要な統計特性を表示する実世界のデータセットでクラスターを検索するのにより適しているかもしれないことを示唆しました。

Expected Information Maximization: Using the I-Projection for Mixture Density Estimation

期待される情報の最大化:混合密度推定のためのIプロジェクションの使用

著者:Philipp Becker, Oleg Arenz, Gerhard Neumann
URL:http://arxiv.org/abs/2001.08682v1

この論文の概要(機械翻訳による和訳)
高度にマルチモーダルなデータのモデリングは、機械学習において困難な問題です。ほとんどのアルゴリズムは、データ分布のモデル分布へのM(oment)投影に対応する尤度の最大化に基づいています。 M-projectionは、モデルが表現できないモードでモデルを強制的に平均化します。対照的に、I(情報)-射影はデータ内のそのようなモードを無視し、モデルが表現できるモードに集中します。このような動作は、すべてのモードをカバーするよりもシングルモードを正しくモデリングすることが重要である高度にマルチモーダルなデータを扱う場合に魅力的です。この利点にもかかわらず、Iプロジェクションは、データに基づいて効率的に最適化できるアルゴリズムがないため、実際にはめったに使用されません。この作業では、一般的な潜在変数モデルのサンプルのみに基づいてI射影を計算するためのExpected Information Maximization(EIM)と呼ばれる新しいアルゴリズムを提示します。ここでは、専門家の混合ガウスモデルと混合ガウスに焦点を当てます。私たちのアプローチは、I-projectionobjectiveに変分上限を適用し、元の目的を各混合成分および係数の単一の目的に分解し、効率的な最適化を可能にします。 GANと同様に、このアプローチでは弁別器を使用しますが、厳密な上限を使用して、より安定した最適化手順を使用します。私たちのアルゴリズムは、最近のGANapproachesよりもI射影の計算にはるかに効果的であることを示し、2つの歩行者および交通予測データセットのマルチモーダル行動をモデル化するアプローチの有効性を示します。

MRI Banding Removal via Adversarial Training

敵対訓練によるMRIバンディング除去

著者:Aaron Defazio, Tullie Murrell, Michael P. Recht
URL:http://arxiv.org/abs/2001.08699v1

この論文の概要(機械翻訳による和訳)
ディープラーニング技術を使用してサブサンプリングデータから再構成されたMRI画像は、多くの場合、特徴的なバンディングを示します。これは、再構成画像の低信号対雑音領域で特に強力です。この作業では、人間の注釈を必要とせずにバンディング構造にペナルティを課す敵対的損失の使用を提案します。この手法は、再構築時に追加の計算や後処理を必要とせずに、バンディングの外観を大幅に減らします。私たちのアプローチは統計的に有意な詳細の損失なしにバンディング除去で優れていると評価されている専門の評価者(委員会認定放射線医)のグループによる強力なベースラインに対するブラインド比較の結果を報告します。

EventMapper: Detecting Real-World Physical Events Using Corroborative and Probabilistic Sources

EventMapper:確証的および確率的ソースを使用した実世界の物理的イベントの検出

著者:Abhijit Suprem, Calton Pu
URL:http://arxiv.org/abs/2001.08700v1

この論文の概要(機械翻訳による和訳)
ソーシャルメディアはどこにでもあるため、災害などの物理的なイベント検出の豊富なソースとなり、危機管理のリソース割り当ての潜在的なリソースとなります。地震やハリケーンなどの大きなイベントの遡及的な事後イベント検出のためにソーシャルメディアソースを活用する最近の研究がいくつかあります。同様に、気候衛星などの従来の物理センサーを使用して地域のイベント検出を実行した長い歴史があります。しかし、リアルタイムで正確かつグローバルな物理的検出を行うために、ソーシャルメディアと実証的な物理的センサーを組み合わせることは未踏のままです。このホワイトペーパーでは、小規模でありながらコストがかかるイベント(地滑り、洪水、山火事)のイベント認識をサポートするフレームワークであるEventMapperについて説明します。 EventMapperは、リアルタイムでグローバルなイベント認識を提供するために、ソーシャルメディアストリームなどの低レイテンシーでノイズの多い確率的ソースを備えた物理センサーなどの高レイテンシーかつ高精度の確証的なソースを統合します。さらに、EventMapperはコンセプトドリフト現象に対して回復力があり、機械学習モデルでは高いパフォーマンスを維持するために継続的な微調整が必​​要です。確率的で確証的なソースの一般的な機能を活用することにより、EventMapperは機械学習モデルの更新、メンテナンス、および微調整を自動化します。地滑り、山火事、洪水の検出のために、EventMapperで構築された3つのアプリケーションについて説明します。

Facial Feedback for Reinforcement Learning: A Case Study and Offline Analysis Using the TAMER Framework

強化学習のための顔のフィードバック:ケーススタディとTAMERフレームワークを使用したオフライン分析

著者:Guangliang Li, Hamdi Dibeklioğlu, Shimon Whiteson, Hayley Hung
URL:http://arxiv.org/abs/2001.08703v1

この論文の概要(機械翻訳による和訳)
対話型強化学習は、エージェントが人間のユーザーによって提供される評価フィードバックからタスクを解決するために学習する方法を提供します。以前の研究では、人間は訓練の初期には豊富なフィードバックを与えますが、その後は非常にまばらになることが示されました。この記事では、エージェントを評価フィードバックとして解釈することにより、エージェントがトレーナーの表情から学習する可能性を調査します。そのために、強化学習ベンチマーク問題— Infinite Marioで人気のあるインタラクティブ強化学習法であるTAMERを実装し、561人の参加者を含むTAMERの最初の大規模な研究を実施しました。設計されたCNN-RNNモデルを使用して、分析により、表情と競争を使用するようトレーナーに伝えると、表情を使用した正および負のフィードバックの推定精度が向上することが示されています。さらに、シミュレーション実験の結果は、顔の表情に基づく予測フィードバックのみから学習することが可能であり、強力/効果的な予測モデルまたは回帰法を使用すると、顔の反応がエージェントのパフォーマンスを大幅に改善することを示しています。さらに、私たちの実験は、トレーニングインターフェースにおける双方向フィードバックと競合要素の重要性を示す以前の研究をサポートしています。

Interpretable End-to-end Urban Autonomous Driving with Latent Deep Reinforcement Learning

潜在的な深層強化学習による解釈可能なエンドツーエンドの都市自動運転

著者:Jianyu Chen, Shengbo Eben Li, Masayoshi Tomizuka
URL:http://arxiv.org/abs/2001.08726v1

この論文の概要(機械翻訳による和訳)
一般的なモジュール化されたフレームワークとは異なり、エンドツーエンドの自動運転は、認識、決定、および制御の問題を統合的な方法で解決しようとするため、新しいシナリオにより適応し、大規模化が容易になります。ただし、既存のエンドツーエンドのアプローチは多くの場合、解釈能力が不足しており、車線維持などの単純な運転タスクのみを処理できます。本論文では、複雑な都市シナリオを処理できる、エンドツーエンドの自動運転のための解釈可能な深層強化学習方法を提案します。シーケンシャルな潜在環境モデルが導入され、強化学習プロセスと共同で学習されます。この潜在モデルを使用して、セマンティックバードアイマスクを生成できます。これは、学習済みポリシーの動作を説明する目的で、今日のモジュール化されたフレームワークの特定の中間プロパティに接続するように強制されます。潜在空間は、強化学習のサンプルの複雑さも大幅に軽減します。 CARLAのシミュレートされた自律走行車との比較テストは、混雑した周辺車両を備えた都市シナリオでの本手法のパフォーマンスが、DQN、DDPG、TD3、SACを含む多くのベースラインを支配していることを示しています。さらに、出力をマスクすることで、学習したポリシーは、自動車が運転環境についてどのように推論するかをより適切に説明することができます。

Robust Explanations for Visual Question Answering

視覚的な質問応答のための堅牢な説明

著者:Badri N. Patro, Shivansh Pate, Vinay P. Namboodiri
URL:http://arxiv.org/abs/2001.08730v1

この論文の概要(機械翻訳による和訳)
本論文では、視覚的質問応答(VQA)の堅牢な説明を得る方法を提案します。私たちのモデルは、視覚的およびテキストによる説明を提供することにより、VQAモデルを通じて得られた回答を説明します。私たちが対処する主な課題は、i)現在の方法によって得られた回答とテキストの説明が十分に相関していないこと、およびii)現在の視覚的説明の方法が回答を説明するための適切な場所に焦点を当てていないことです。ノイズベースの攻撃を訓練しなくても、相関の強化により正しい説明と回答が生成されることを保証する協調相関モジュールを使用して、これらの両方の課題に対処します。さらに、これは生成された視覚的およびテキストによる説明の改善にも役立つことを示しています。相関モジュールの使用は、回答と説明が一貫しているかどうかを検証するための堅牢な方法と考えることができます。 VQA-Xデータセットを使用してこのモデルを評価します。提案された方法は、決定をサポートするより良いテキストと視覚の正当化をもたらすことを観察します。対応する視覚的およびテキストの説明を使用して、ノイズベースの摂動攻撃に対するモデルの堅牢性を示します。詳細な実証分析が示されています。ここで、モデル url {https://github.com/DelTA-Lab-IITK/CCM-WACV}のソースコードリンクを提供します。

Cross-Domain Few-Shot Classification via Learned Feature-Wise Transformation

学習された特徴ごとの変換を介したクロスドメイン少数ショット分類

著者:Hung-Yu Tseng, Hsin-Ying Lee, Jia-Bin Huang, Ming-Hsuan Yang
URL:http://arxiv.org/abs/2001.08735v1

この論文の概要(機械翻訳による和訳)
少数ショット分類は、各クラスでラベル付けされた画像がほとんどない新しいカテゴリを認識することを目的としています。既存のメトリックベースの少数ショット分類アルゴリズムは、学習されたメトリック関数を使用して、クエリ画像の特徴埋め込みといくつかのラベル付き画像(サポート例)の特徴埋め込みを比較することにより、カテゴリを予測します。有望なパフォーマンスが実証されていますが、これらの方法は、ドメイン間の機能分布の大きな不一致により、多くの場合、見えないドメインへの一般化に失敗します。この作業では、メトリックベースのメソッドのドメインシフトの下での数ショット分類の問題に対処します。 Ourcoreのアイデアは、アフィン変換を使用して画像機能を強化するために、機能ごとの変換レイヤーを使用して、トレーニング段階で異なるドメインの下でさまざまな機能分布をシミュレートすることです。異なるドメインの下での特徴分布のバリエーションをキャプチャするために、学習によるアプローチを適用して、特徴ごとの変換レイヤーのハイパーパラメーターを検索します。 5つの少数ショット分類データセット:mini-ImageNet、CUB、Cars、Places、およびPlantaeを使用して、ドメインの一般化設定の下で広範な実験とアブレーション研究を実施します。また、ドメインシフト下での少数ショットの分類パフォーマンスを一貫して改善します。

Communication Efficient Federated Learning over Multiple Access Channels

複数のアクセスチャネルを介した通信効率のよい連合学習

著者:Wei-Ting Chang, Ravi Tandon
URL:http://arxiv.org/abs/2001.08737v1

この論文の概要(機械翻訳による和訳)
この作業では、分散ユーザーがパラメーターサーバー(PS)の助けを借りて機械学習モデルを共同でトレーニングすることを目的とする連合学習(FL)の問題を研究します。 FLの各反復で、ユーザーは局所勾配を計算し、その後に続くPSでの集計およびモデル更新のために量子化勾配を送信します。 FLの課題の1つは、FLの反復的な性質と大きなモデルサイズによる通信のオーバーヘッドです。 FLでの通信のボトルネックを軽減する1つの最近の方向は、ユーザーが多元接続チャネル(MAC)で同時に通信できるようにすることで、通信リソースをより有効に活用できるようにすることです。このペーパーでは、MACを介したFL学習の問題について検討します。特に、各ユーザーの勾配が最初に量子化され、次にPSで個別にデコードされるMACを介して送信される、MACを介したデジタル勾配伝送方式の設計に焦点を当てています。 MACを介してデジタルFLスキームを設計する場合、a)各ユーザーの勾配の情報量、およびb)基礎となるチャネル条件に基づいて、異なる量のリソース(レートや帯域幅など)を異なるユーザーに割り当てる新しい機会があります。 MACの容量領域に基づいて量子化パラメーターが最適化される確率的勾配量子化スキームを提案します。 FLのこのようなチャネル認識量子化は、特にユーザーが異なるチャネル条件を経験し、さまざまな情報レベルの勾配がある場合に、均一量子化よりも優れていることを示します。

分野/キーワード:

論文ナビに登録すると・・・
①最新情報をメールでお届け!
  • 話題のニュース一覧
  • 注目のプレスリリース
  • 論文解説・最近のイベント
②論文解説記事の投稿
  • ご自身の論文の解説
  • 読んだ論文のメモ
  • 研究に関する情報のシェア
③セミナー情報の宣伝
  • ご自身が主催するイベント情報を投稿してシェア
  • ユーザーで作るセミナー日程まとめに参加
【併せて読みたい関連記事】
X
- Enter Your Location -
- or -
パスワード再発行
お気に入り
  • Total (0)
0