機械学習分野論文まとめ【2020年01月29日arXiv公開】

アブストまとめ
Like0
お気に入り

2020年01月29日に発表された機械学習分野の論文68本のAbstractをまとめて和訳しました。

この記事の見出し

Identifying Mislabeled Data using the Area Under the Margin Ranking

マージンランキング下のエリアを使用したラベルの間違ったデータの特定

著者:Geoff Pleiss, Tianyi Zhang, Ethan R. Elenberg, Kilian Q. Weinberger
URL:http://arxiv.org/abs/2001.10528v1

この論文の概要(機械翻訳による和訳)
一般的なトレーニングセットのすべてのデータが一般化に役立つわけではありません。一部のサンプルは、過度に曖昧であるか、完全にラベルが間違っている可能性があります。このホワイトペーパーでは、このようなサンプルを特定し、ニューラルネットワークをトレーニングする際の影響を軽減する新しい方法を紹介します。アルゴリズムの中心となるのは、きれいなサンプルと誤ってラベル付けされたサンプルのトレーニングダイナミクスの違いを活用する、Area Under the Margin(AUM)統計です。単純な手順-意図的に誤ってラベル付けされたインジケーターサンプルが追加された余分なクラスを追加する-は、このメトリックに基づいて誤ってラベル付けされたデータを分離するしきい値を学習します。このアプローチは、合成および実世界のデータセットに関する事前作業を一貫して改善します。 WebVision50classificationタスクで、このメソッドはトレーニングデータの17%を削除し、テストエラーが2.6%(絶対)改善されます。 CIFAR100では、データの13%を削除すると、エラーが1.2%低下します。

Multi-class Gaussian Process Classification with Noisy Inputs

ノイズの多い入力によるマルチクラスガウスプロセス分類

著者:Carlos Villacampa-Calvo, Bryan Zaldivar, Eduardo C. Garrido-Merchán, Daniel Hernández-Lobato
URL:http://arxiv.org/abs/2001.10523v1

この論文の概要(機械翻訳による和訳)
監視対象の機械学習コミュニティでは、入力属性に観測データにノイズがないと想定するのが一般的ですが、実際の問題では、測定値が完全に正確ではないため、入力ノイズのあるシナリオが一般的です。この入力ノイズが考慮されない場合、教師付き機械学習法が最適に実行されないことが予想されます。この論文では、マルチクラス分類問題に焦点を当て、基礎となる分類子としてガウス過程(GP)を使用します。天体物理学の領域からのデータセットによって動機付けられ、観測されたデータが入力にノイズを含む可能性があるという仮説を立てます。したがって、入力ノイズを考慮できる複数のclassGP分類器を考案します。このような分類器は、モデルの潜在変数の事後分布を近似するために、変分推論を使用して効率的にトレーニングできます。さらに、状況によっては、ノイズの量を事前に知ることができます。これが当てはまる場合、提案された方法で容易に導入できます。この事前情報は、パフォーマンスの向上につながると予想されます。これらのデータには、UCIリポジトリからのいくつかのデータセット、MNISTデータセット、および天体物理学からのデータセットが含まれます。得られた結果は、分類誤差はメソッド間で似ていますが、提案されたメソッドの予測分布は、入力ノイズを無視するGPに基づく分類器の予測分布よりも、テストログ尤度の点で優れていることを示しています。

Tri-graph Information Propagation for Polypharmacy Side Effect Prediction

多剤併用副作用予測のためのトライグラフ情報伝播

著者:Hao Xu, Shengqi Sang, Haiping Lu
URL:http://arxiv.org/abs/2001.10516v1

この論文の概要(機械翻訳による和訳)
薬物の組み合わせを使用すると、多くの場合、多剤併用副作用(POSE)が発生します。最近の方法では、薬物とタンパク質のグラフ上のリンク予測問題としてPOSE予測を定式化し、Graph Convolutional Networks(GCN)で解決します。ただし、POSEの複雑な関係により、この方法には高い計算コストとメモリ需要があります。この論文では、3つのサブグラフで動作する柔軟なTri-graphInformation Propagation(TIP)モデルを提案します。実験により、TIPは精度を7%以上、時間効率を83 $ times $、スペース効率を3 $ times $向上させることが示されています。

MSE-Optimal Neural Network Initialization via Layer Fusion

レイヤーフュージョンによるMSE最適ニューラルネットワークの初期化

著者:Ramina Ghods, Andrew S. Lan, Tom Goldstein, Christoph Studer
URL:http://arxiv.org/abs/2001.10509v1

この論文の概要(機械翻訳による和訳)
ディープニューラルネットワークは、分類および推論タスクの範囲で最先端のパフォーマンスを実現します。ただし、基礎となる最適化問題の非凸性と組み合わされた確率的勾配降下の使用は、初期化の影響を受けやすいパラメータ学習をレンダリングします。この問題に対処するために、ランダムパラメーターの初期化または知識の蒸留に依存するさまざまな方法が過去に提案されています。この論文では、ランダム初期化で訓練されたより深いネットワークの隣接レイヤーを融合することにより、より浅いネットワークを初期化する新しい方法であるFuseInitを提案します。平均二乗誤差(MSE)の理論結果と効率的なアルゴリズムを開発します。これは、隣接する高密度、畳み込み、および畳み込み-畳み込み層の最適な融合です。 FuseInitで初期化された場合、より深いニューラルネットワークは初期化の影響を受けにくく、より低いニューラルネットワークは(場合によってはより深いカウンターパートも)より良いパフォーマンスを発揮できることを示唆する、分類および回帰データセットの範囲の実験を示します。

Rich-Item Recommendations for Rich-Users via GCNN: Exploiting Dynamic and Static Side Information

GCNNを介したリッチユーザー向けのリッチアイテムの推奨事項:動的および静的なサイド情報の活用

著者:Amar Budhiraja, Gaurush Hiranandani, Navya Yarrabelly, Ayush Choure, Oluwasanmi Koyejo, Prateek Jain
URL:http://arxiv.org/abs/2001.10495v1

この論文の概要(機械翻訳による和訳)
関連するアイテムをユーザーに推奨する標準的な問題を調査します。ユーザーは推奨を求める人であり、アイテムは推奨されるものです。今日の現代世界では、ユーザーとアイテムの両方が「豊富な」多面的なエンティティですが、モデリングを容易にするために、既存の文献はサイロでこれらのファセットを表示します。この論文では、現代のシステムの複雑さを捉え、既存の推奨システムの定式化のほとんどを包含する推奨問題の一般的な定式化を提供します。公式では、各ユーザーとアイテムは、静的エンティティと動的コンポーネントのセットを介してモデル化されます。エンティティ間の関係は、複数の重み付けされた2部グラフによってキャプチャされます。これらの複雑な相互作用を推奨のために効果的に活用するために、複数のグラフCNNベースの新規の深層学習アーキテクチャであるMEDRESを提案します。さらに、さまざまな分類+ランク付けシナリオにとって重要な新しいメトリックpAp @ kを提案します。また、提案されたメトリックを直接最適化し、エンドツーエンドのフレームワークでMEDRESをトレーニングする最適化アルゴリズムも提供します。 2つのベンチマークと、Microsoft Teamsに展開されているメッセージ推奨システムで、この方法の有効性を実証し、既存の生産グレードモデルを3%改善します。

Real-time Out-of-distribution Detection in Learning-Enabled Cyber-Physical Systems

学習可能なサイバー物理システムでのリアルタイムの配信外検出

著者:Feiyang Cai, Xenofon Koutsoukos
URL:http://arxiv.org/abs/2001.10494v1

この論文の概要(機械翻訳による和訳)
サイバーフィジカルシステム(CPS)は、実世界の不確実性と変動性を処理できる機械学習コンポーネントを使用することで大きなメリットを得ますが、ディープニューラルネットワークなどの典型的なコンポーネントは、システムの安全性に影響を与える可能性のある新しい種類の危険をもたらします。システムの動作は実行時にのみ利用可能なデータに依存し、トレーニングに使用されるデータとは異なる場合があります。配布されていないデータは、大きなエラーと安全性の侵害につながる可能性があります。このペーパーでは、CPS制御システムで配信外データを効率的に検出する問題を検討しています。検出は堅牢であり、誤報の数を制限すると同時に、リアルタイム監視のために計算効率が高い必要があります。提案されたアプローチは、誘導共形予測と異常検出を活用して、十分に較正された誤警報率を持つ方法を開発します。変分オートエンコーダーとディープサポートベクターデータの説明を使用して、トレーニングセットに対する新しい入力の不適合を効率的に計算し、分布外の高次元入力のリアルタイム検出を可能にするモデルを学習します。自動運転車用のオープンソースシミュレータに実装された高度な緊急ブレーキシステムと自動運転のエンドツーエンドコントローラを使用して、この方法を実証します。シミュレーション結果では、実行時間がオリジナルの機械学習コンポーネントの実行時間に匹敵する間、非常に少数の誤検知と検出遅延が示されています。

Fast Graph Metric Learning via Gershgorin Disc Alignment

Gershgorin Disc Alignmentによる高速グラフメトリック学習

著者:Cheng Yang, Gene Cheung, Wei Hu
URL:http://arxiv.org/abs/2001.10485v1

この論文の概要(機械翻訳による和訳)
最小化目標$ min _ { M in cS} Q( M)$がメトリック行列$ M $および$ M $の凸微分可能関数である、高速で一般的な射影のないメトリック学習フレームワークを提案します。正のエッジ重みとノード次数を持つ連結グラフの一般化グラフラプラシアン行列のセット$ cS $に存在します。文学で一般的な低ランクのメトリック行列とは異なり、$ cS $は制限の特殊なケースとして重要な正対角のみの行列を含みます。高速最適化の鍵となるアイデアは、$ M $の対角項と非対角項の交互最適化を効率的に解くことができるように、Gershgorinディスクアライメントを介した信号適応線形制約として$ cS $の正定円錐制約を書き換えることです。 Frank-Wolfe反復を介したプログラム。ゲルシュゴリンのディスクは、$ M $の最初の固有ベクトル$ v $を使用して完全にアライメントできることを証明します。これは、対角/非対角項が最適化されたウォームスタートのLocally Optimal Block Preconditioned ConjugateGradient(LOBPCG)を使用して繰り返し更新されます。実験は、効率的に計算されたグラフメトリックマトリックスが、分類タスクに関して競合する方法を使用して学習したメトリックよりも優れていることを示しています。

Fast quantum learning with statistical guarantees

統計的保証付きの高速量子学習

著者:Carlo Ciliberto, Andrea Rocchetto, Alessandro Rudi, Leonard Wossnig
URL:http://arxiv.org/abs/2001.10477v1

この論文の概要(機械翻訳による和訳)
統計学習理論の枠組み内で、学習者が目標の精度に到達するために必要なサンプルの最小数を制限することが可能です。使用可能-入力ディメンションで多対数ランタイムを達成できません。これは、データへの量子アクセスが自然に利用できる場合でも、学習問題の量子高速化を慎重に再評価する必要があります。

Parameter Sharing in Coagent Networks

Coagentネットワークでのパラメーター共有

著者:Modjtaba Shokrian Zini
URL:http://arxiv.org/abs/2001.10474v1

この論文の概要(機械翻訳による和訳)
この論文では、CoagentNetwork Policy Gradient Theorem(Kostas et al。、2019)を、関連する関数近似器間でパラメーターが共有されるコンテキストに一般化する定理を証明することを目的としています。これにより、パラメータ共有の任意のパターンを使用し、ネットワークのグラフ構造の自由度を活用して、特定のタスクでのリレーショナルバイアスを活用するための理論的基盤が提供されます。別のアプリケーションとして、結果を適用して、(Riemer et。al。、2019)で最初に示された階層オプションの批評家PolicyGradient定理のより直感的な証明を提供します。

Incorporating Joint Embeddings into Goal-Oriented Dialogues with Multi-Task Learning

マルチタスク学習による目標指向対話への共同埋め込みの組み込み

著者:Firas Kassawat, Debanjan Chaudhuri, Jens Lehmann
URL:http://arxiv.org/abs/2001.10468v1

この論文の概要(機械翻訳による和訳)
注意ベースのエンコーダ/デコーダニューラルネットワークモデルは、目標指向の対話システムで有望な結果を最近示しています。ただし、これらのモデルは、エンドツーエンドのテキスト生成機能を維持しながら、状態を完全に把握し、それを組み込むことに苦労しています。このようなモデルはユーザーの意図とナレッジグラフの統合から大きなメリットを得ることができるため、本書では、入力としてナレッジグラフとコーパスの共同埋め込みでトレーニングされるRNNベースのエンドツーエンドエンコーダーデコーダーアーキテクチャを提案します。このモデルは、誤ったエンティティを出力として生成することを罰するための追加の正規化技術とともにマルチタスク学習パラダイムでトレーニングされた、テキスト生成とともにユーザー意図の追加統合を提供します。モデルはさらに、推論中にナレッジグラフエンティティルックアップを組み込んで、生成された出力が提供されたローカルナレッジグラフに基づいてステートフルであることを保証します。最終的にBLEUスコアを使用してモデルを評価し、経験的評価は、提案されたアーキテクチャがタスク指向の対話システムのパフォーマンスの向上に役立つことを示しています。

Residual Tangent Kernels

残差タンジェントカーネル

著者:Etai Littwin, Lior Wolf
URL:http://arxiv.org/abs/2001.10460v1

この論文の概要(機械翻訳による和訳)
最近の一連の研究では、幅の広い領域でのニューラルネットワークの理論的研究に焦点が当てられています。具体的には、L2損失を使用した無限幅で適切にスケーリングされたバニラReLUネットワークのトレーニングは、初期化インスタンスに依存せず、トレーニング中は一定のままであるNeural Tangent Kernelを使用したカーネル回帰と同等であることが示されました。この作業では、バイパス接続、つまり残留ネットワーク(ResNets)と密に接続されたネットワーク(DenseNets)を組み込んだアーキテクチャの制限カーネルの形式を導き出します。さらに、両方のケースについて有限幅補正を導き出します。私たちの分析は、深い実用的な残留アーキテクチャが、バニラの対応物よりも「カーネル」レジームにはるかに近い動作をする可能性があることを明らかにしています。 ResNetsとDenseNetsの両方で、適切な初期化が提供されると、無限の深部ネットワークとワイドネットワークで制限カーネルへの収束が発生する場合があります。

NAS-Bench-1Shot1: Benchmarking and Dissecting One-shot Neural Architecture Search

NAS-Bench-1Shot1:ワンショットニューラルアーキテクチャ検索のベンチマークと分析

著者:Arber Zela, Julien Siems, Frank Hutter
URL:http://arxiv.org/abs/2001.10422v1

この論文の概要(機械翻訳による和訳)
ワンショットニューラルアーキテクチャ検索(NAS)は、NASメソッドを実際に計算可能にするために重要な役割を果たしてきました。それにもかかわらず、プロセスのダイナミクスを制御する多くの要因のため、これらの重み共有アルゴリズムが正確にどのように機能するかについてはまだ理解が不足しています。これらのコンポーネントの科学的研究を可能にするために、最近導入された多くの亜種にインスタンス化できるワンショットNASの一般的なフレームワークを導入し、最近の大規模なテーブルベンチマークNAS-Bench-101を安価に利用する一般的なベンチマークフレームワークを導入しますワンショットNASmethodsのいつでも評価。フレームワークを紹介するために、いくつかの最先端のNASメソッドを比較し、それらがハイパーパラメーターに敏感であることと、ハイパーパラメーターを調整することでどのように改善できるかを調べ、NAS-Benchのブラックボックスオプティマイザーのパフォーマンスと比較します-101。

OPFython: A Python-Inspired Optimum-Path Forest Classifier

OPFython:Pythonにヒントを得た最適パスフォレスト分類子

著者:Gustavo Henrique de Rosa, João Paulo Papa, Alexandre Xavier Falcão
URL:http://arxiv.org/abs/2001.10420v1

この論文の概要(機械翻訳による和訳)
機械学習技術は、分類、オブジェクト認識、個人識別、画像セグメンテーションなどの幅広いタスクに適用されており、過去数年にわたって最重要でした。それにもかかわらず、LogisticRegression、デシジョンツリー、ベイズ分類器などの従来の分類アルゴリズム、複雑さと多様性に欠ける可能性があり、実際のデータを扱う場合には適切ではありません。 Optimum-Path Forestとして知られる最近のグラフにヒントを得た分類器は、Support Vector Machinesに匹敵する最先端の技術であることが証明されており、一部のタスクでもそれを凌evenしています。この記事では、すべての機能とクラスが元のC言語実装に基づいているOPFythonと呼ばれるPythonベースの最適パスフォレストフレームワークを提案します。さらに、OPFythonはPythonベースのライブラリであるため、より使いやすい環境を提供します。 C言語よりも高速なプロトタイピングワークスペース。

QActor: On-line Active Learning for Noisy Labeled Stream Data

QActor:ノイズのあるラベル付きストリームデータのオンラインアクティブラーニング

著者:Taraneh Younesian, Zilong Zhao, Amirmasoud Ghiassi, Robert Birke, Lydia Y. Chen
URL:http://arxiv.org/abs/2001.10399v1

この論文の概要(機械翻訳による和訳)
ノイズの多いラベル付きデータは、Webやソーシャルメディアで継続的に公開される自己生成コンテンツの希少性というよりも一般的です。プライバシーの懸念と政府の規制により、このようなデータストリームは、限られた期間で学習目的にのみ保存および使用できます。このオンラインシナリオのノイズを克服するために、私たちは小説を組み合わせたQActorを提案します:品質モデルを介したおそらくきれいなサンプルの選択と、最も有益な真のラベルのオラクルへの積極的なクエリ。前者はオンラインシナリオのデータ量が少ないことに苦しむ可能性がありますが、後者は人間の専門家の可用性とコストに制約されます。 QActorは、データフィルタリングの品質モデルと最も有益なデータをクリーニングするためのOracleクエリのメリットを迅速に組み合わせます。QActorの目的は、厳格なOracle予算を活用して、学習精度を堅牢に最大化することです。 QActorは、異なるクエリの割り当てと不確実性の尺度を組み合わせたさまざまな戦略を探ります。 QActorの中心的な機能は、各データバッチの学習損失に従ってクエリ制限を動的に調整することです。標準の機械学習(ML)モデルまたはディープニューラルネットワーク(DNN)であるノイズラベル比が30%から80%の範囲にある分類器に供給されるさまざまな画像データセットを広範囲に評価します。私たちの結果は、QActorは、オラクルからのグラウンドトゥルースデータの最大6%の追加コストで、クリーンなデータのみを使用して達成される最適な精度にほぼ一致することを示しています。

Bandit optimisation of functions in the Matérn kernel RKHS

MatérnカーネルRKHSの関数のバンディット最適化

著者:David Janz, David R. Burt, Javier González
URL:http://arxiv.org/abs/2001.10396v1

この論文の概要(機械翻訳による和訳)
ノイズの多いバンディットフィードバック下で、ドメイン$ [0,1] ^ d $上のパラメーター$ nu $を持つMat ‘ernファミリーカーネルのRekering kernelHilbert空間(RKHS)で関数を最適化する問題を検討します。私たちの貢献である$ pi $ -GP-UCBアルゴリズムは、すべての$ nu> 1 $および$ d geq 1 $の部分線形後悔が保証された最初の実用的なアプローチです。実証的検証により、その前身であるGP-UCBの改良と比較して、パフォーマンスが向上し、計算のスケーラビリティが大幅に向上したことが示唆されます。

Graph Neighborhood Attentive Pooling

グラフ近傍注意プーリング

著者:Zekarias T. Kefato, Sarunas Girdzijauskas
URL:http://arxiv.org/abs/2001.10394v1

この論文の概要(機械翻訳による和訳)
ネットワーク表現学習(NRL)は、高次元およびスパースグラフの低次元ベクトル表現を学習するための強力な手法です。ほとんどの研究では、ランダムウォークを使用してグラフに関連する構造とメタデータを調査し、教師なしまたは半教師付き学習スキームを採用しています。ノードごとに1つの表現しか学習されないため、これらのメソッドはコンテキストフリーです。最近の研究では、単一表現の十分性について議論し、リンク予測やランキングなどのアプリケーションで非常に効果的であることが証明された状況依存アプローチを提案しています。ただし、これらの方法のほとんどは、RNNまたはCNNが必要な追加のテキスト機能に依存して高レベルの機能をキャプチャするか、コミュニティ検出アルゴリズムに依存してノードの複数のコンテキストを識別します。この研究では、追加の機能やコミュニティ検出アルゴリズムを必要とせずに、注意深いプーリングネットワークを使用してノードの近隣のさまざまな部分に参加することを学習するGAPと呼ばれる新しいコンテキスト依存アルゴリズムを提案します。リンク予測およびノー​​ドクラスタリングタスクで3つの実世界のデータセットを使用してGAPの有効性を示し、10の人気のある(SOTA)ベースラインと比較します。 GAPは一貫してパフォーマンスを上回り、リンク予測およびクラスタリングタスクでそれぞれ最高のパフォーマンスを発揮する方法と比較して、最大約9%および最大20%のゲインを達成します。

A random forest based approach for predicting spreads in the primary catastrophe bond market

プライマリカタストロフ債市場のスプレッドを予測するためのランダムフォレストベースのアプローチ

著者:Despoina Makariou, Pauline Barrieu, Yining Chen
URL:http://arxiv.org/abs/2001.10393v1

この論文の概要(機械翻訳による和訳)
ランダムフォレストアプローチを導入して、プライマリカタストロフボンド市場でスプレッドの予測を可能にします。新たな発行に先立って提供サーキュラーの投資家に提供されるすべての情報が、その広がりを予測する上で同様に重要であるかどうかを調査します。 2009年12月から2018年5月までに発行された生命災害以外の債券の全人口が使用されます。ランダムフォレストは、変動の合計の93%を説明する、目に見えないプライマリカタストロフボンドデータに印象的な予測力を示しています。比較のために、ベンチマークモデルである線形回帰の予測性能は劣っていて、全体の変動の47%しか説明していません。オファリングサーキュラーで提供されるすべての詳細は、広がりを予測しますが、程度は異なります。結果の安定性が研究されています。ランダムフォレストの使用は、大惨事債券業界での投資決定をスピードアップできます。

Statistical Exploration of Relationships Between Routine and Agnostic Features Towards Interpretable Risk Characterization

解釈可能なリスク特性評価に向けた日常的および不可知論的特徴間の関係の統計的調査

著者:Eric Wolsztynski
URL:http://arxiv.org/abs/2001.10353v1

この論文の概要(機械翻訳による和訳)
ハイスループットシステムの他の応用分野で一般的なように、放射線学は、ラジオミクス分析から派生したモデルなど、ますます洗練された予測モデルを解釈するという課題に直面しています。各テクニック。この出力モデルがどうであれ、いくつかの重要な疑問を提起します。臨床実施のための予後モデルをどのように解釈しますか?臨床的に解釈可能なモデルを作成するために、どのようにして一連の放射特性内の潜在的な情報構造を特定できますか?また、機能間の潜在的な関係を再解釈または活用して、解釈可能性を向上させるにはどうすればよいですか?さまざまな角度からの放射線学的特徴間の(おそらく非線形の)関係を評価するために、多くの統計的手法が検討されています。

WISDoM: a framework for the Analysis of Wishart distributed matrices

WISDoM:Wishart分散行列の分析のためのフレームワーク

著者:Carlo Mengucci, Daniel Remondini, Enrico Giampieri
URL:http://arxiv.org/abs/2001.10342v1

この論文の概要(機械翻訳による和訳)
WISDoM(Wishart Distributed Matrices)は、Wishart分布をヌルモデルとして、共分散行列や相関行列などの実験サンプルに関連付けられた対称正定行列の特性評価のための新しいフレームワークです。 WISDoMは、そのような行列が異なる次元のデータ(たとえば、変数の数は同じだが時間サンプリングが異なる時系列)によって生成される場合でも、分類などの教師あり学習のタスクに適用できます。特に、脳波(EEG)データに関連付けられた特徴を時系列設計でランク付けする方法の適用を示し、このタイプの研究に理論的に健全なアプローチを提供します。

Multi-Source Deep Domain Adaptation for Quality Control in Retail Food Packaging

小売食品包装の品質管理のためのマルチソースディープドメイン適応

著者:Mamatha Thota, Stefanos Kollias, Mark Swainson, Georgios Leontidis
URL:http://arxiv.org/abs/2001.10335v1

この論文の概要(機械翻訳による和訳)
小売食品包装には、製品名、成分リスト、栄養情報、アレルゲン、調製ガイドライン、パック重量、保管および保存期限の情報(使用期限/賞味期限など)を含む、消費者の健康に役立つ情報が含まれています。このような情報の存在と正確性は、製品の詳細な理解を確保し、健康上のリスクの可能性を減らすために重要です。その結果、誤った判読不能なラベリングは、消費者およびサプライチェーンの他の多くの利害関係者にとって非常に有害である可能性があります。この論文では、マルチソースの深層学習ベースのドメイン適応システムを提案し、テストして、製品が食品生産ラインを通過する際の検証プロセスの一環として撮影された食品包装写真から使用期限情報の存在と読みやすさを特定および検証します。これは、すべてのドメインのドメイン不変表現を抽出するためにマルチソースデータセットを使用し、クラスの境界とともに、共通の特徴空間でソースドメインとターゲットドメインのすべてのペアの分布を調整することにより、技術の一般化を改善することで達成されました。提案されたシステムは、検証プロセスを自動化し、そうでなければ公衆衛生を脅かし、食品包装の情報と正確性に関する法的要件に違反する可能性のあるラベリングエラーを削減するために、実施された実験で非常に良好に機能しました。この方法は、分類精度を大幅に改善するため、食品製造管理システムへの適用と有益な影響の大きな可能性を秘めています。

Margin Maximization as Lossless Maximal Compression

ロスレス最大圧縮としてのマージン最大化

著者:Nikolaos Nikolaou, Henry Reeve, Gavin Brown
URL:http://arxiv.org/abs/2001.10318v1

この論文の概要(機械翻訳による和訳)
教師あり学習アルゴリズムの最終目標は、トレーニングデータに基づいて構築されたモデルを作成して、新しい例にうまく一般化できるようにすることです。分類、機能マージンの最大化-最大限の信頼度で可能な限り多くのトレーニング例を正しく分類する-は、一般化保証が良好なモデルを構築することが知られています。この作業により、ノイズのないトレーニングデータセットのマージン最大化モデルの情報理論的解釈が、前述のデータセットのロスレス最大圧縮を実現するものとして提供されます。つまり、特徴を抽出して、ラベルを予測するためのすべての有用な情報のみを抽出します。この接続は、教師付き機械学習の一般化に関する新しい洞察を提供し、マージンの最大化をより一般的な原則の(分類の)特殊なケースとして示し、勾配ブースティングなどの一般的な学習アルゴリズムの成功と潜在的な制限を説明します。私たちは理論的議論と経験的証拠で観察を支持し、将来の研究の興味深い方向を特定します。

Causal query in observational data with hidden variables

隠された変数を持つ観測データの因果クエリ

著者:Debo Cheng, Jiuyong Li, Lin Liu, Jixue Liu, Kui Yu, Thuc Duy Le
URL:http://arxiv.org/abs/2001.10269v1

この論文の概要(機械翻訳による和訳)
この論文では、操作変数と結果に影響を与えるもっともらしい交絡変数のセットを与えながら、変数を「操作」する際に結果の変化を求めることを目的として、隠された変数を持つ観測データの因果クエリの問題について議論します。操作変数の因果効果を推定するこのような「データの実験」は、履歴データを使用した実験計画の検証や、新しい関係を研究する際の交絡因子の探索に役立ちます。ただし、既存のデータ駆動型の因果効果推定方法には、高次元データのスケーラビリティの低さ、グローバルな因果構造学習アルゴリズムで使用されるヒューリスティックによる推定精度の低さ、隠された変数が不可避なデータである場合の因果充足の仮定など、いくつかの大きな課題があります。この論文では、現実的な前処理の仮定の下で、観測データから因果効果推定の調整(または交絡)変数のスーパーセットを見つけるためにローカル検索を使用するための定理を開発します。定理は、因果効果の不偏推定値が因果のセットで得られることを保証します調整変数のスーパーセットによって推定される効果。開発された定理に基づいて、因果クエリのためのデータ駆動型アルゴリズムを提案します。実験により、提案されたアルゴリズムは、隠された変数を使用した既存のデータ駆動型の因果効果推定法よりも高速であり、より良い因果効果推定を生成することが示されています。アルゴリズムによって推定された因果効果は、ドメイン知識を使用した最先端の方法による因果効果と同等です。

Controlling generative models with continuous factors of variations

変動の連続因子による生成モデルの制御

著者:Antoine Plumerault, Hervé Le Borgne, Céline Hudelot
URL:http://arxiv.org/abs/2001.10238v1

この論文の概要(機械翻訳による和訳)
最近の深い生成モデルは、写真のようにリアルな画像だけでなく、コンピュータービジョンや自然言語処理のさまざまなタスクに対処するのに役立つ視覚的またはテキストコンテンツの埋め込みを提供できます。それにもかかわらず、それらの有用性は、生成プロセッサに対する制御の欠如、学習された表現の不十分な理解によってしばしば制限されます。これらの主要な問題を克服するために、ごく最近の研究は、生成モデルの潜在空間の意味論を研究することへの関心を示しています。本論文では、生成モデルの潜在空間の解釈可能性を向上させることを提案します。これにより、生成モデルの位置やスケールなどの特定のプロパティを正確に制御するために移動できる任意の生成モデルの潜在空間で意味のある方向を見つける新しい方法を導入することにより、画像内のオブジェクトの。私たちの方法は、人間の注釈を必要とせず、生成された画像の単純な変換、例えば、翻訳、ズーム、色の変化などをエンコードする方向の検索に特に適しています。 GANと変分オートエンコーダーの両方について、定性的および定量的に本方法の有効性を実証します。

Faster Activity and Data Detection in Massive Random Access: A Multi-armed Bandit Approach

大量のランダムアクセスでのアクティビティとデータ検出の高速化:多腕バンディットアプローチ

著者:Jialin Dong, Jun Zhang, Yuanming Shi, Jessie Hui Wang
URL:http://arxiv.org/abs/2001.10237v1

この論文の概要(機械翻訳による和訳)
このホワイトペーパーでは、大規模なIoTデバイスを使用した無償のランダムアクセスを調査します。署名シーケンスにデータシンボルを埋め込むことにより、共同デバイスアクティビティ検出とデータデコードを実現できますが、計算の複雑さが大幅に増加します。検出の問題を解決するために、反復ごとの複雑さが低い座標降下アルゴリズムが採用されていますが、以前の研究では通常、収束が遅いランダム座標選択ポリシーが採用されています。この論文では、座標降下を介したより効率的な検出のための多腕バンディットアプローチを開発します。これにより、座標選択における探索と活用の間の微妙なトレードオフが行われます。具体的には、どの座標が目的関数のより積極的な降下をもたらすかを学習することにより、座標降下の収束速度を高速化するためのバンディットベースの戦略、すなわちベルヌーイサンプリングを最初に提案します。収束率をさらに改善するために、ベルヌーイサンプリングの探査ポリシーを学習するために、内部の多腕バンディット問題が確立されます。収束率分析とシミュレーション結果の両方が提供され、提案されているバンディットベースのアルゴリズムは、最新のアルゴリズムと比較して、より短い時間の複雑さで、より高速な収束率を享受できることを示しています。さらに、提案されたアルゴリズムは、さまざまなシナリオ、たとえば、低精度のアナログ-デジタルコンバーター(ADC)を使用した大規模なランダムアクセスに適用できます。

CLCNet: Deep learning-based Noise Reduction for Hearing Aids using Complex Linear Coding

CLCNet:複雑な線形コーディングを使用した補聴器用の深層学習ベースのノイズ低減

著者:Hendrik Schröter, Tobias Rosenkranz, Alberto N. Escalante B., Marc Aubreville, Andreas Maier
URL:http://arxiv.org/abs/2001.10218v1

この論文の概要(機械翻訳による和訳)
ノイズリダクションは、現代の補聴器の重要な部分であり、ほとんどの市販のデバイスに含まれています。ただし、ディープラーニングベースの最新のアルゴリズムでは、リアルタイムおよび周波数の解像度の制約を考慮しないか、非常にノイズの多い条件下で品質が低下します。ノイズの多い環境でのモノラル音声強化を改善するために、複雑な値の線形コーディングに基づくフレームワークであるCLCNetを提案します。まず、複雑な周波数領域で適用される線形予測コーディング(LPC)を動機とする複素線形コーディング(CLC)を定義します。次に、複雑なスペクトログラム入力と係数出力を組み込むフレームワークを提案します。第三に、低レイテンシおよびオンライン処理に準拠した複雑な値のスペクトログラムのパラメトリック正規化を定義します。当社のCLCNetは、EUROMデータベースと、補聴器で記録された実際のノイズデータセットの混合物で評価され、従来の実際のWienerフィルタゲインと比較されました。

Robust Method for Semantic Segmentation of Whole-Slide Blood Cell Microscopic Image

全スライド血球顕微鏡画像の意味的セグメンテーションのためのロバストな方法

著者:Muhammad Shahzad, Arif Iqbal Umar, Muazzam A. Khan, Syed Hamad Shirazi, Zakir Khan, Waqas Yousaf
URL:http://arxiv.org/abs/2001.10188v1

この論文の概要(機械翻訳による和訳)
SEM(走査型電子顕微鏡)血球画像のセグメンテーションに関する以前の研究では、スライド全体の血球セグメンテーションのセマンティックセグメンテーションアプローチは無視されます。提案された作業では、セマンティックセグメンテーションアプローチを使用して、スライド全体の血球セグメンテーションの問題に対処します。ピクセルレベルの特徴抽出モデルとして、VGG-16とともに、新しい畳み込みエンコーダ-デコーダフレームワークを設計します。 -e提案されたフレームワークは、3つの主要なステップで構成されています。最初に、すべての元の画像と手動で生成された各血球タイプのグラウンドトゥルースマスクが前処理段階を通過します。前処理段階では、ピクセルレベルのラベル付け、マスクされた画像とピクセルフュージングのRGBからグレースケールへの変換、および統一マスク生成が実行されます。その後、VGG16がシステムに読み込まれ、事前学習済みのピクセルレベルの特徴抽出モデルとして機能します。 3番目のステップでは、提案されたモデルでトレーニングプロセスが開始されます。 3つの評価指標でネットワークパフォーマンスを評価しました。私たちは、クラスワイズだけでなく、グローバルおよび平均精度に関しても優れた結果を得ました。我々のシステムは、RBC、WBC、および血小板についてそれぞれ97.45%、93.34%、および85.11%のクラス単位の精度を達成しましたが、グローバルおよび平均の精度はそれぞれ97.18%および91.96%のままです。

Revisiting Graph based Collaborative Filtering: A Linear Residual Graph Convolutional Network Approach

グラフベースの協調フィルタリングの再考:線形残差グラフ畳み込みネットワークアプローチ

著者:Lei Chen, Le Wu, Richang Hong, Kun Zhang, Meng Wang
URL:http://arxiv.org/abs/2001.10167v1

この論文の概要(機械翻訳による和訳)
グラフ畳み込みネットワーク(GCN)は、畳み込み集計操作と非線形活性化操作の複数の層を繰り返しスタックすることによる、最先端のグラフベースの表現学習モデルです。一部の研究者は、2部グラフとしてのユーザーと項目の相互作用の振る舞いを、GCNとの上位層の協調信号をモデル化します。これらのGCNベースの推奨モデルは、従来の作品と比較して優れたパフォーマンスを示しますが、これらのモデルは、大きなユーザーアイテムグラフの非線形アクティベーションでトレーニングが困難です。その上、ほとんどのGCNベースのモデルは、グラフ畳み込み操作による過剰な平滑化効果のため、より深い層をモデル化できませんでした。このホワイトペーパーでは、2つの側面からGCNベースのCFモデルを再検討します。最初に、非線形性を除去することで推奨性能が向上することを経験的に示します。これは単純グラフ畳み込みネットワークの理論と一致しています。次に、CF向けに特別に設計された残差ネットワーク構造を提案します。これは、疎なユーザーアイテムインタラクションデータを使用したグラフコンボリューション集約操作における過剰平滑化問題を軽減します。提案されたモデルは線形モデルであり、トレーニング、大規模なデータセットへのスケーリング、および2つの実際のデータセットの効率と効率の向上が容易です。ソースコードはhttps://github.com/newlei/LRGCCFで公開しています。

COKE: Communication-Censored Kernel Learning for Decentralized Non-parametric Learning

COKE:分散型ノンパラメトリック学習のための通信検閲カーネル学習

著者:Ping Xu, Yue Wang, Xiang Chen, Tian Zhi
URL:http://arxiv.org/abs/2001.10133v1

この論文の概要(機械翻訳による和訳)
この論文では、複数の相互接続されたエージェントが、ローカルに観測されたデータのみにアクセスして、グローバルな目的関数を共同で最小化することにより、再生カーネルヒルベルト(RKH)空間で定義された最適な決定関数を学習する分散型最適化および学習問題を研究します。非パラメトリックアプローチとして、カーネル学習は分散実装で大きな課題に直面しています:ローカルの目的関数の決定変数は異なるサイズのデータ​​に依存しているため、エージェント間の生のデータ交換なしに分散型コンセンサスフレームワークの下で最適化することはできません。データのプライバシーを保護するために、ランダム機能(RF)近似アプローチを活用して、RKH空間で表される大容量データをより小さなRF空間にマッピングします。これにより、同じサイズのパラメーター交換が容易になり、分散エージェントが、 RF空間のパラメーター。高速な収束実装のために、乗数の交互方向法(DKLA)による分散型カーネル学習の反復アルゴリズムを設計します。さらに、DKLAの通信負荷を軽減するために、通信検閲KErnel学習(COKE)アルゴリズムを開発します。そのために、通信検閲戦略を適用します。これにより、ローカル更新が有益であると見なされない限り、エージェントが反復ごとに送信するのを防ぎます。 DKLAおよびCOKEの線形収束保証および一般化パフォーマンス分析に関する理論結果が提供されます。 COKEの通信効率と学習効果を検証するために、合成データセットと実データセットの両方を使用した包括的なテストが実施されます。

Regret Bounds for Decentralized Learning in Cooperative Multi-Agent Dynamical Systems

協調マルチエージェント動的システムにおける分散学習のための後悔の限界

著者:Seyed Mohammad Asghari, Yi Ouyang, Ashutosh Nayyar
URL:http://arxiv.org/abs/2001.10122v1

この論文の概要(機械翻訳による和訳)
マルチエージェント強化学習(MARL)では、主にエージェント間の動的環境と分散情報のため、後悔分析は困難です。マルチエージェント線形2次(LQ)動的システムでの分散学習のコンテキストでこの課題を解決しようとします。各システムがエージェントによって制御される2つのエージェントと2つの動的に分離された確率線形システムで構成される単純なセットアップから始めます。システムは、二次コスト関数を介して結合されます。両方のシステムのダイナミクスが不明で、エージェント間で通信がない場合、学習ポリシーが$ T $後悔でサブリニアを生成できないことを示します。ここで、$ T $は時間範囲です。 1つのシステムのダイナミクスのみが不明であり、不明なシステムを制御するエージェントから他のエージェントへの一方向の通信がある場合、補助シングルエージェントLQ問題の構築に基づくMARLアルゴリズムを提案します。提案されているMARLアルゴリズムの補助的な単一​​エージェントの問題は、2つの学習エージェント間の暗黙的な調整メカニズムとして機能します。これにより、エージェントは、補助的な単一​​エージェントの問題の後悔から$ O( sqrt {T})$以内に後悔を達成できます。その結果、シングルエージェントLQの後悔の既存の結果を使用して、アルゴリズムは$ tilde {O }( sqrt {T})$後悔の限界。 (ここで$ tilde {O}( cdot)$は定数と対数因子を隠します)。私たちの数値実験は、この限界が実際に一致することを示しています。 2エージェントの問題から、特定の通信パターンを持つマルチエージェントLQシステムに結果を拡張します。

Unsupervised Program Synthesis for Images using Tree-Structured LSTM

ツリー構造LSTMを使用した画像の教師なしプログラム合成

著者:Chenghui Zhou, Chun-Liang Li, Barnabas Poczos
URL:http://arxiv.org/abs/2001.10119v1

この論文の概要(機械翻訳による和訳)
プログラム合成は、画像解析タスクへの有望なアプローチとして最近登場しました。ただし、ほとんどの先行研究は、各トレーニング画像にグラウンドトゥルースプログラムを必要とする教師あり学習法に依存しています。非微分可能なレンダラーを使用して、構成的立体幾何(CSG)画像をコンテキストフリーの文法に解析できる教師なし学習アルゴリズムを紹介します。 REINFORCEを介して微分不可能なレンダラーを処理し、エントロピー用語で目的を正則化することで探索を促進する一方で、文脈に依存しない文法の構造を活用することにより、検索空間を効果的に制約するための文法エンコードされたツリーLSTMを提案します。単純なモンテカルロサンプリングを使用する代わりに、効果的な探索のための置換なしでサンプリングを行う低分散エントロピー推定器を提案します。ベースラインモデルを大幅に上回る合成2D CSGdatasetでの提案アルゴリズムの有効性を実証します。

Supervised Learning for Non-Sequential Data with the Canonical Polyadic Decomposition

正準ポリアディック分解による非シーケンシャルデータの教師あり学習

著者:Alexandros Haliassos, Kriton Konstantinidis, Danilo P. Mandic
URL:http://arxiv.org/abs/2001.10109v1

この論文の概要(機械翻訳による和訳)
最近、機械学習システムの分析と設計にテンソルネットワークを利用することに、理論的および実用的な関心が高まっています。特に、サポートベクターマシンや従来のディープラーニングテクニックとは異なり、高密度データ(標準回帰または分類タスクなど)とスパースデータ(推奨システムなど)の両方を処理できるフレームワークが提案されています。つまり、ローカルフィーチャマッピングをデータに適用し、外積演算子を介して、フィーチャの機能のすべての相互作用をモデリングすると解釈できます。対応する重みは、計算の扱いやすさのテンソルネットワークとして表されます。この論文では、適切な正則化および初期化スキームを含むCanonical Polyadic(CP)分解による教師あり学習のための効率的な予測および学習アルゴリズムを導出します。 CPベースのモデルは、標準の非シーケンシャルタスクでのテンソルトレイン(TT)分解に基づく既存のモデルと同等以上のパフォーマンスを発揮し、より優れたonMovieLens 100Kを実証します。さらに、2次元の局所特徴マップをデータに適用した以前の作品とは対照的に、モデルの表現力の強力なレバーを得るために、フレームワークを一般化して任意の高次元マップを処理します。その安定性と一般化機能を強化するために、機能マップの正規化バージョンを提案します。私たちの実験は、このバージョンが非正規化および/または2次元マップを劇的に改善し、ニューラルネットワークを含む人気モデルと比較して非シーケンシャルな教師あり学習タスクのパフォーマンスを向上させることを示しています。

Predicting Regression Probability Distributions with Imperfect Data Through Optimal Transformations

最適な変換による不完全なデータを使用した回帰確率分布の予測

著者:Jerome H. Friedman
URL:http://arxiv.org/abs/2001.10102v1

この論文の概要(機械翻訳による和訳)
回帰分析の目標は、他の(予測)変数xの結合値のベクトルが与えられた場合に数値結果変数yの値を予測することです。通常、特定のxベクトルはyの反復可能な値を指定せず、可能性の確率分布y-値、p(y | x)。この分布には位置、スケール、形状があり、それらはすべてxに依存する可能性があり、xが与えられた場合にyの可能性のある値を推測するために必要です。回帰法では、通常、トレーニングデータのy値が、何らかの適切にp(y | x)から得られた完全な数値実現であると想定します。多くの場合、実際のトレーニングデータのy値は、離散、打ち切り、および/または任意の打ち切りです。最適な変換戦略に基づく回帰手順は、そのような不完全なトレーニングデータが存在する可能性がある場合に、xの一般関数としてp(y | x)の位置、スケール、および形状を推定するために提示されます。さらに、ソリューションの品質を確認するための検証診断が提示されます。

Multi-label Prediction in Time Series Data using Deep Neural Networks

ディープニューラルネットワークを使用した時系列データのマルチラベル予測

著者:Wenyu Zhang, Devesh K. Jha, Emil Laftchiev, Daniel Nikovski
URL:http://arxiv.org/abs/2001.10098v1

この論文の概要(機械翻訳による和訳)
このペーパーでは、多次元時系列データのマルチラベル予測障害分類問題に対処します。障害(イベント)検出の問題は文献で徹底的に研究されていますが、最先端の技術のほとんどは、望ましい将来の期間にわたって障害(イベント)を確実に予測することはできません。これらのタイプの問題の最も一般的な設定では、複数の時系列にわたる1つ以上のデータのサンプルに、既知の有限セットからの複数の同時障害ラベルを割り当てることができます。このタイプの問題には通常、いくつかのクラスが少数のサンプルのみで表される強力なクラス不均衡が伴います。重要なのは、障害予測や予知保全などの問題の多くのアプリケーションで、最も興味深いのはまさにこれらのまれなクラスです。この問題に対処するために、このペーパーでは、不均衡なクラスでの学習を強調する新しいコスト関数を備えたマルチラベルリカレントニューラルネットワークを利用する一般的なアプローチを提案します。提案されたアルゴリズムは、2つの公開ベンチマークデータセットでテストされています。PHMSociety Data Challengeの工業用プラントデータセットと、人間活動認識データセットです。結果は、時系列分類のための最新技術と比較され、評価はF1スコア、精度、および再現率を使用して実行されます。

LIBTwinSVM: A Library for Twin Support Vector Machines

LIBTwinSVM:ツインサポートベクターマシン用のライブラリ

著者:Amir M. Mir, Mahdi Rahbar, Jalal A. Nasiri
URL:http://arxiv.org/abs/2001.10073v1

この論文の概要(機械翻訳による和訳)
このペーパーでは、ツインサポートベクターマシン(TSVM)用の無料で効率的なオープンソースライブラリであるLIBTwinSVMを紹介します。私たちのライブラリは、高速TSVM推定器、モデル選択、視覚化、グラフィカルユーザーインターフェイス(GUI)アプリケーション、Pythonアプリケーションプログラミングインターフェイス(API)などの便利な機能のセットを提供します。ベンチマークの結果は、大規模な分類問題に対するLIBTwinSVMライブラリの有効性を示しています。 LIBTwinSVMライブラリのソースコード、インストールガイド、ドキュメント、および使用例は、https://github.com/mir-am/LIBTwinSVMで入手できます。

Multivariate Gaussian Variational Inference by Natural Gradient Descent

自然勾配降下法による多変量ガウス変分推論

著者:Timothy D. Barfoot
URL:http://arxiv.org/abs/2001.10025v1

この論文の概要(機械翻訳による和訳)
この短いメモでは、多変量ガウス分布のいわゆる自然勾配降下(NGD)について説明します。フィッシャー情報マトリックス(FIM)は、ガウス分布のいくつかの異なるパラメーター化から導出されます。導関数を計算するときは、共分散行列の対称性に注意が払われます。平均共分散行列と逆共分散行列を含むパラメーター化を選択することにはいくつかの利点があり、逆共分散行列の対称(およびスパース)性を考慮した単純なNGD​​更新を提供することを示します。

Variational Optimization on Lie Groups, with Examples of Leading (Generalized) Eigenvalue Problems

リーグループの変分最適化、および主要な(一般化された)固有値問題の例

著者:Molei Tao, Tomoki Ohsawa
URL:http://arxiv.org/abs/2001.10006v1

この論文の概要(機械翻訳による和訳)
この記事では、Lieグループの関数のスムーズな最適化を検討しています。ベクトル空間のNAG変分原理(Wibisono et al。、2016)をリー群に一般化することにより、局所最適に収束することが保証される連続的なリーNAGダイナミクスが得られます。これらは、Lieグループのgradientflowのモメンタムバージョンに対応します。次に、主要なGeneralizedEigenValue問題に対応する目的関数を使用して、$ mathsf {SO}(n)$の特定のケースを詳細に研究します。忠実なエネルギーの振る舞い(共形的双曲性による)で、Lieグループに正確に残ります。確率的勾配バージョンも調査されます。合成データと実際の問題(MNISTのLDA)の両方に関する数値実験は、提案された方法が最適化アルゴリズム(分類方法として$ not $)として有効であることを示しています。

Towards a Human-like Open-Domain Chatbot

人間に似たオープンドメインチャットボットに向けて

著者:Daniel Adiwardana, Minh-Thang Luong, David R. So, Jamie Hall, Noah Fiedel, Romal Thoppilan, Zi Yang, Apoorv Kulshreshtha, Gaurav Nemade, Yifeng Lu, Quoc V. Le
URL:http://arxiv.org/abs/2001.09977v1

この論文の概要(機械翻訳による和訳)
Meenaを公開します。これは、パブリックドメインのソーシャルメディアの会話からデータマイニングおよびフィルター処理されたエンドツーエンドのマルチターンオープンドメインチャットボットです。この2.6Bパラメータニューラルネットワークは、複雑さを最小限に抑えるようにトレーニングされています。これは、マルチターンの会話品質の人間の判断と比較する自動メトリックです。この判断をキャプチャするために、私たちは良好な会話の重要な要素をキャプチャする感度と特異度平均(SSA)と呼ばれる人間の評価指標を提案します。興味深いことに、我々の実験は、複雑さとSSAの間に強い相関関係があることを示しています。エンドツーエンドで最適なパープレキシティがSSAでトレーニングされたMeenascores(マルチターン評価で72%)であるという事実は、パープレキシティをより適切に最適化できる場合、86%の人間レベルのSSAが潜在的に到達可能であることを示唆しています。 Meena(フィルタリングメカニズムとtuneddecodingを使用)のスコアは79%SSAで、次に評価したスコアリングチャットボットよりも23%高くなりました。

Reinforcement Learning-based Autoscaling of Workflows in the Cloud: A Survey

クラウド内のワークフローの強化学習ベースの自動スケーリング:調査

著者:Yisel Garí, David A. Monge, Elina Pacini, Cristian Mateos, Carlos García Garino
URL:http://arxiv.org/abs/2001.09957v1

この論文の概要(機械翻訳による和訳)
強化学習(RL)は、複雑な不確実な環境で意思決定の問題を自動的に解決する大きな可能性を示しています。基本的に、RLは確率的行動の環境での相互作用を通じて学習することを可能にする計算アプローチを提案し、エージェントはいくつかの累積的な短期的および長期的な報酬を最大化するためのアクションを取ります。最も印象的な結果のいくつかは、エージェントがGoやStarcraft 2などのゲームで超人的なパフォーマンスを示したゲーム理論で示されており、クラウドコンピューティングを含む他の多くのドメインで採用されました。与えられた最適化基準に従ったワークフローの。これは意思決定の問題であり、計算リソースをいつ、どのようにスケールアップ/ダウンするかを確立する必要があります。そして、今後の処理ワークロードにそれらを割り当てる方法。動的で不確実な環境であるクラウドの最適化基準を考慮して、このようなアクションを実行する必要があります。これにより、多くの作業がRLをクラウドの自動スケーリング問題に適用します。この作業では、主要会場からの提案を徹底的に調査し、提案された分類法に基づいてそれらを均一に比較します。また、未解決の問題について議論し、この分野での将来の研究の展望を提供します。

Near real-time map building with multi-class image set labelling and classification of road conditions using convolutional neural networks

畳み込みニューラルネットワークを使用したマルチクラス画像セットラベリングと道路状況の分類によるほぼリアルタイムのマップ構築

著者:Sheela Ramanna, Cenker Sengoz, Scott Kehler, Dat Pham
URL:http://arxiv.org/abs/2001.09947v1

この論文の概要(機械翻訳による和訳)
天気は、輸送と交通安全に影響を与える重要な要素です。このホワイトペーパーでは、最先端の畳み込みニューラルネットワークを活用して、北米全域にある道路カメラと高速道路カメラで撮影した画像にラベルを付けます。道路状況によって画像を分類するために、道路カメラのスナップショットが複数の深層学習フレームワークを使用した実験で使用されました。これらの実験のトレーニングデータでは、乾燥、湿潤、雪/氷、貧弱、オフラインのラベルが付いた画像を使用しました。実験では、この問題に対する適合性を評価するために、6つの畳み込みニューラルネットワーク(VGG-16、ResNet50、Xception、InceptionResNetV2、EfficientNet-B0、およびEfficientNet-B4)のさまざまな構成をテストしました。精度、精度、および再現率は、各フレームワーク構成で測定されました。さらに、トレーニングセットは、全体のサイズと個々のクラスのサイズの両方で変化しました。最終的なトレーニングセットには、前述の5つのクラスを使用してラベル付けされた47,000枚の画像が含まれていました。 EfficientNet-B4frameworkはこの問題に最も適していることがわかり、検証精度90.6%を達成しましたが、EfficientNet-B0は実行時間の半分で90.3%の精度を達成しました。転送学習を備えたVGG-16は、このプロジェクト全体で、限られたハードウェアリソースを使用したデータ取得および擬似ラベル付けに非常に役立つことが確認されました。その後、EfficientNet-B4フレームワークは、リアルタイムの実稼働環境に配置され、そこでは画像を継続的にリアルタイムで分類することができました。次に、分類された画像を使用して、北米全域のさまざまなカメラ位置でのリアルタイムの道路状況を示す地図を作成しました。これらのフレームワークの選択と分析では、リアルタイムのマップ構築機能の固有の要件を考慮します。これらのフレームワークを使用した半自動化されたデータセットのラベル付けプロセスの詳細な分析も、このホワイトペーパーで説明します。

A Precision Medicine Approach to Develop and Internally Validate Optimal Exercise and Weight Loss Treatments for Overweight and Obese Adults with Knee Osteoarthritis

変形性膝関節症の過体重および肥満の成人に対する最適な運動および減量治療を開発および内部検証するための精密医学アプローチ

著者:Xiaotong Jiang, Amanda E. Nelson, Rebecca J. Cleveland, Daniel P. Beavers, Todd A. Schwartz, Liubov Arbeeva, Carolina Alvarez, Leigh F. Callahan, Stephen Messier, Richard Loeser, Michael R. Kosorok
URL:http://arxiv.org/abs/2001.09930v1

この論文の概要(機械翻訳による和訳)
運動の参加者(E)、食事による減量(D)、および変形性膝関節症(KOA)のD + Etrialの期待される結果を最大化するための最適な治療レジメンを決定するための精密医療アプローチを提案しました。 Intensive Diet and Exercisefor Arthritis(IDEA)トライアルの343人の参加者からのデータを使用して、24の機械学習モデルを適用して、SF-36物理成分コア、体重減少、WOMAC疼痛/機能/剛性スコア、圧縮性の7つの結果に関する個別の治療ルールを開発しました力、およびIL-6。最適なモデルは、将来の参加者が最適な単一の固定治療モデルと比較して推定決定ルールに従う場合の結果の改善を示すジャックナイフ値関数推定に基づいて選択されました。複数の結果のランダムフォレストは、WOMACの結果の最適なモデルでした。その他の結果については、リストベースのモデルが最適でした。たとえば、体重減少の推定最適決定ルールは、ベースライン重量が109.35 kgを超えず、胴囲が90.25 cmを超える参加者にD + Einterventionを割り当て、心臓発作の履歴を持っている参加者を除く他のすべての参加者にDを割り当てます。将来の参加者に適用された場合、減量の最適なルールは、18か月で平均減量を11.2 kgに増加させると推定されますが、すべてがD + E(p = 0.01)を受けた場合は9.8 kgでした。 IDEAは、ほとんどの参加者にとってD + E介入が最適であるが、参加者のサブグループは、2つの結果について食事だけからより多くの利益を得る可能性が高いという証拠がありました。

Rotation, Translation, and Cropping for Zero-Shot Generalization

ゼロショット一般化のための回転、変換、およびトリミング

著者:Chang Ye, Ahmed Khalifa, Philip Bontrager, Julian Togelius
URL:http://arxiv.org/abs/2001.09908v1

この論文の概要(機械翻訳による和訳)
Deep Reinforcement Learning(DRL)は、視覚入力、特にさまざまなゲームのあるドメインで印象的なパフォーマンスを示しています。ただし、エージェントは通常、固定環境でトレーニングされます。固定数のレベル。ますます多くの証拠が、これらの訓練されたモデルが、訓練された環境のわずかな変動に一般化できないことを示唆しています。この論文は、一般化の欠如が部分的に入力表現によるものであるという仮説を進め、回転、トリミング、および翻訳が一般性をどのように高めることができるかを調査します。切り取り、翻訳、回転した観測は、2次元のアーケードゲームの見えないレベルでより一般化できることを示します。エージェントの一般性は、人間が設計した一連のレベルで評価されます。

Predicting Yield Performance of Parents in Plant Breeding: A Neural Collaborative Filtering Approach

植物育種における親の収量パフォーマンスの予測:神経協調フィルタリングアプローチ

著者:Saeed Khaki, Zahra Khalilzadeh, Lizhi Wang
URL:http://arxiv.org/abs/2001.09902v1

この論文の概要(機械翻訳による和訳)
実験的なトウモロコシハイブリッドは、2つの親、いわゆる近交系とテスターを一緒に交配することにより、植物育種プログラムで作成されます。親の可能な交差の組み合わせの総数は多く、時間と予算の限られたリソースのために可能なすべての交差の組み合わせをテストすることは非現実的であるため、交差のための最良の親の組み合わせの識別は困難である。 2020年のシンジェンタクロップチャレンジで、シンジェンタは、2016年から2018年の間に280の場所に植えられた496のテスターと593の同系交配の合計交配の約4%の過去の収量パフォーマンスを記録したいくつかの大きなデータセットをリリースし、参加者に同系交配の交配パフォーマンスの予測を求めましたそして、他の近交系およびテスターの交配から収集された過去の収量データに基づいて植え付けられていないテスター。本論文では、この問題を解決するための行列因子分解法とニューラルネットワークのアンサンブルである協調フィルタリング法を提示します。計算結果から、提案されたモデルはLASSO、ランダムフォレスト(RF)、およびニューラルネットワークなどの他のモデルを大幅に上回ることが示唆されました。提示された方法と結果は、2020年シンジェンタクロップチャレンジ内で作成されました。

Eigen-Stratified Models

固有層モデル

著者:Jonathan Tuck, Stephen Boyd
URL:http://arxiv.org/abs/2001.10389v1

この論文の概要(機械翻訳による和訳)
階層化モデルは、$ K $値を取る選択されたカテゴリ機能に任意の方法で依存し、他の$ n $特徴に線形に依存します。特徴値のグラフに対するラプラシアン正則化は、特に階層化モデルのパフォーマンスを大幅に改善できます。低データ体制。ラプラシアン正則化成層モデルの重要な問題は、モデルがベースモデルのサイズの$ K $倍であり、かなり大きくなる可能性があることです。モデルパラメーターがグラフラプラシアンの底部固有ベクトルの適度な数$ m $、つまり$ m $最小固有値に関連するものの線形結合であるという追加の制約を持つ層化モデルである固有層モデルを定式化することにより、この問題に対処します。固有層化モデルでは、$ m $の底部固有ベクトルと対応する係数を層化モデルパラメーターとして保存するだけです。これにより、$ m leq n $および$ m ll K $の場合にモデルサイズが大きくなることがありますが、場合によっては、固有層化モデルの暗黙の追加正則化により、標準ラプラシアン正規化成層法よりもサンプル外のパフォーマンスが向上しますモデル。

Estimating heterogeneous treatment effects with right-censored data via causal survival forests

因果サバイバルフォレストを介した右打ち切りデータによる不均一な治療効果の推定

著者:Yifan Cui, Michael R. Kosorok, Stefan Wager, Ruoqing Zhu
URL:http://arxiv.org/abs/2001.09887v1

この論文の概要(機械翻訳による和訳)
観察研究では、ランダムな森林を介した不均一な治療効果の推定に関する急成長している文献があります。ただし、右打ち切りの生存データに利用できるアプローチはほとんどありません。臨床試験では、右打ち切りの生存データに頻繁に遭遇します。治療と生存結果との因果関係を定量化することは非常に興味深い。ランダムフォレストは、統計的推定に対する堅牢でノンパラメトリックなアプローチを提供する。さらに、最近の開発により、森林ベースの手法で、推定される不均一な処理効果の不確実性を定量化できます。観察研究から治療効果を推定することを直接目標とする因果サバイバルフォレストを提案します。提案された推定量の一貫性と漸近正規性を確立し、推定治療効果の有効な信頼区間を可能にする漸近分散の推定量を提供します。私たちのアプローチのパフォーマンスは、広範なシミュレーションとHIV研究からのデータを介して実証されています。

Bayesian nonparametric shared multi-sequence time series segmentation

ベイジアンノンパラメトリック共有マルチシーケンス時系列セグメンテーション

著者:Olga Mikheeva, Ieva Kazlauskaite, Hedvig Kjellström, Carl Henrik Ek
URL:http://arxiv.org/abs/2001.09886v1

この論文の概要(機械翻訳による和訳)
この論文では、ベイジアンノンパラメトリックのツールを使用して時系列データをセグメント化する方法を紹介します。時系列データのセットを一時的なセグメント化して代表的な静止セグメントにするタスクを検討します。ガウス過程(GP)事前分布を使用して、基礎となる定常セグメントの特性に関する知識を課し、ノンパラメトリック分布を使用して、セグメント長の事前分布に関して定式化されたシーケンスをそのようなセグメントに分割します。セグメンテーションが与えられると、モデルは、混合成分がGPの共分散関数を使用して記述されるガウス混合モデルのバリアントと見なすことができます。私たちは、合成データおよび心拍のリアルタイムの時系列データに対するモデルの有効性を実証します。ここでは、心拍の記録を健康的な異常な心音に対応するクラスに分類するために、指標となる種類のビートをセグメント化することがタスクです。

The POLAR Framework: Polar Opposites Enable Interpretability of Pre-Trained Word Embeddings

POLARフレームワーク:極地の反対語は事前学習済みの単語埋め込みの解釈を可能にします

著者:Binny Mathew, Sandipan Sikdar, Florian Lemmerich, Markus Strohmaier
URL:http://arxiv.org/abs/2001.09876v2

この論文の概要(機械翻訳による和訳)
POLARを導入します。これは、意味の差異を採用することで、事前に訓練された単語の埋め込みに解釈可能性を追加するフレームワークです。セマンティックディファレンシャルは、2つの極の正反対のスケール(コールド-ホット、ソフト-ハード)でスケールでその位置を分析することにより、ワードのセマンティクスを測定するための心理測定構成です。私たちのアプローチの核となる考え方は、既存の事前学習済みの単語埋め込みを、セマンティック差分を介して、そのような極の対極によって定義される解釈可能な次元を持つ新しい「極」空間に変換することです。オラクル、すなわち外部ソースによって。さまざまなダウンストリームタスクにフレームワークを展開することにより、フレームワークの有効性を実証します。このタスクでは、解釈可能な単語の埋め込みにより、元の単語の埋め込みに匹敵するパフォーマンスが得られます。また、フレームワークによって選択された解釈可能な次元が人間の判断と一致することを示します。一緒に、これらの結果は、パフォーマンスを損なうことなく、語の埋め込みに解釈可能性を追加できることを示しています。私たちの仕事は、事前に訓練された単語埋め込みの解釈に興味のある研究者やエンジニアに関連しています。

Exploiting Unsupervised Inputs for Accurate Few-Shot Classification

正確な少数ショット分類のための教師なし入力の活用

著者:Yuqing Hu, Vincent Gripon, Stéphane Pateux
URL:http://arxiv.org/abs/2001.09849v1

この論文の概要(機械翻訳による和訳)
少数ショット分類の目的は、ラベル付けされた少数の例だけでクラスを区別できるモデルを学習することです。ほとんどの文献は、一度に1つの未知の入力にラベルを付ける問題を考慮しています。代わりに、ラベルのない入力のバッチを結合して独立して処理しない設定を検討することは有益です。この論文では、3つのレベルの情報を活用できる方法を提案します:a)汎用データセットで事前にトレーニングされた特徴抽出器、b)区別するクラスのラベルの少ない例、およびc)その他の利用可能なラベルのない入力a)で最先端のアプローチを使用する場合、b)とc)を一緒に実行するための単純化されたグラフ畳み込みの使用を導入します。提案されたモデルは、標準の数発ビジョン分類データセットで利用可能な代替物と比較して、6〜11ドルの増加で最先端の精度に達します。

Polygames: Improved Zero Learning

ポリゲーム:ゼロ学習の改善

著者:Tristan Cazenave, Yen-Chi Chen, Guan-Wei Chen, Shi-Yu Chen, Xian-Dong Chiu, Julien Dehos, Maria Elsa, Qucheng Gong, Hengyuan Hu, Vasil Khalidov, Cheng-Ling Li, Hsin-I Lin, Yu-Jin Lin, Xavier Martinet, Vegard Mella, Jeremy Rapin, Baptiste Roziere, Gabriel Synnaeve, Fabien Teytaud, Olivier Teytaud, Shi-Cheng Ye, Yi-Jun Ye, Shi-Jim Yen, Sergey Zagoruyko
URL:http://arxiv.org/abs/2001.09832v1

この論文の概要(機械翻訳による和訳)
DeepMindのAlphaZero以来、ゼロ学習はすぐに多くのボードゲームの最先端の方法になりました。完全に畳み込み構造(完全に接続された層なし)を使用して改善できます。このようなアーキテクチャとグローバルプーリングを使用して、ボードサイズに関係なくボットを作成できます。トレーニング中に最適なチェックポイントを追跡し、それらに対してチェックすることにより、トレーニングをより堅牢にすることができます。これらの機能を使用して、ゲームのライブラリとチェックポイントを備えた、ゼロ学習のためのフレームワークであるPolygamesをリリースします。 19×19のHexのゲームで強い人間と対戦しましたが、これは学習なしでは手に負えないとしばしば言われました。ハバナで。また、TAAI大会でいくつかの優勝を獲得しました。

Uncertainty-based Modulation for Lifelong Learning

生涯学習のための不確実性ベースの変調

著者:Andrew Brna, Ryan Brown, Patrick Connolly, Stephen Simons, Renee Shimizu, Mario Aguilar-Simon
URL:http://arxiv.org/abs/2001.09822v1

この論文の概要(機械翻訳による和訳)
継続的な生涯学習が可能なインテリジェントエージェント向けの機械学習アルゴリズムの作成は、動的環境の実際のシステムに展開されるアルゴリズムの重要な目標です。ここでは、Stephen Grossbergの画期的なAdaptiveResonance Theoryの提案を統合し拡張する、人間の脳の神経調節機構に触発されたアルゴリズムを紹介します。具体的には、不確実性の概念に基づいて構築され、一連の神経調節メカニズムを採用して、自己監視型学習とワンショット学習を含む継続的な学習を可能にします。壊滅的な忘却を伴わない安定した学習を実証する一連のベンチマーク実験で、アルゴリズムコンポーネントが評価されました。また、環境とエージェントの動作が学習プロセスを制約およびガイドする閉ループ方式でこれらのシステムを開発する重要な役割を示します。そのために、アルゴリズムを具現化されたシミュレートドローンエージェントに統合しました。実験により、アルゴリズムは、壊滅的な忘却を伴わずに、仮想環境で高い分類精度(94%を超える)で新しいタスクを継続的に学習し、条件を変更できることが示されています。このアルゴリズムは、最先端の検出および特徴抽出アルゴリズムからの高次元入力を受け入れ、既存のシステムへの柔軟な追加を可能にします。また、アルゴリズムに新しい知識を求め、より広範な神経調節プロセスを採用するメカニズムを組み込むことに焦点を当てた将来の開発努力についても説明します。

One Explanation Does Not Fit All: The Promise of Interactive Explanations for Machine Learning Transparency

1つの説明がすべてに当てはまるわけではない:機械学習の透明性のためのインタラクティブな説明の約束

著者:Kacper Sokol, Peter Flach
URL:http://arxiv.org/abs/2001.09734v1

この論文の概要(機械翻訳による和訳)
機械学習アルゴリズムに基づく予測システムの透明性の必要性は、業界での増え続ける増殖の結果として生じています。ブラックボックスアルゴリズムの予測が人事に影響を与えるときはいつでも、これらのアルゴリズムの内部動作を精査し、システムエンジニア、システムのオペレーター、ケースが決定されている個人などの関連する利害関係者にその決定を説明する必要があります。さまざまな解釈可能性と説明可能性の方法が利用可能ですが、それらはいずれも、関係者が必要とする可能性のあるすべての多様な期待と競合する目的を満たすことができる万能薬ではありません。この課題では、対比的な説明の例を使用して、ブラックボックスシステムの透明性を向上させるInteractiveMachine Learningの約束について説明します。これは、解釈可能な機械学習の最先端のアプローチです。具体的には、条件文を対話的に調整して反事実的な説明をパーソナライズする方法を示し、フォローアップの「What if?」質問。このタイプのシステムを構築、展開、および提示した経験により、インタラクティブな説明者の開発をガイドするために使用できる、望ましいプロパティと潜在的な制限をリストできました。対話の媒体、つまりさまざまな通信チャネルで構成されるユーザーインターフェイスをカスタマイズすることで、パーソナライズの印象を与えることができますが、説明自体とその内容を調整することがより重要であると主張します。この目的のために、説明の幅、範囲、コンテキスト、目的、ターゲットなどのプロパティを考慮する必要があります。さらに、その制限と注意事項について明示的に説明する必要があります…

DP-CGAN: Differentially Private Synthetic Data and Label Generation

DP-CGAN:差分的にプライベートな合成データとラベル生成

著者:Reihaneh Torkzadehmahani, Peter Kairouz, Benedict Paten
URL:http://arxiv.org/abs/2001.09700v1

この論文の概要(機械翻訳による和訳)
Generative Adversarial Networks(GAN)は、画像を含む合成データを生成するための有名なモデルの1つです。特に、公開されていないため元の機密データセットを使用できない研究コミュニティ向けです。この分野の主な課題の1つは、GANモデルのトレーニングに参加する個人のプライバシーを保護することです。この課題に対処するために、トレーニングデータセットのプライバシーを保持しながらモデルのパフォーマンスを向上させる、新しいクリッピングおよび摂動戦略に基づく差分プライベート条件付きGAN(DP-CGAN)トレーニングフレームワークを導入します。 DP-CGANは、合成データと対応するラベルの両方を生成し、最近導入されたRenyi差分プライバシー会計担当者を活用して、使用済みのプライバシー予算を追跡します。実験結果は、DP-CGANが、微分プライバシーの1桁のイプシロンパラメーターを使用して、MNISTデータセットで視覚的および経験的に有望な結果を生成できることを示しています。

¶ILCRO: Making Importance Landscapes Flat Again

¶ILCRO:重要なランドスケープを再びフラットにする

著者:Vincent Moens, Simiao Yu, Gholamreza Salimi-Khorshidi
URL:http://arxiv.org/abs/2001.09696v1

この論文の概要(機械翻訳による和訳)
畳み込みニューラルネットワークは、画像分類、オブジェクト検出、シーケンスモデリングなど、多数のタスクで大きな成功を収めています。一般に、そのようなニューラルネットワークは並進不変であると想定されます。つまり、入力画像内の位置とは無関係に特定の特徴を検出できるということです。これは、ネットワークが限られた数のレイヤークラスで構成され、画像が非常に単純な単純な場合に当てはまりますが、一般的な最先端のネットワークを備えた複雑な画像は、通常、この特性を享受できません。このホワイトペーパーでは、既存の畳み込みアーキテクチャのほとんどが、初​​期化時に、トレーニング中またはテスト時にも画像のさまざまな場所に対応する能力を制限する特定の機能重要性ランドスケープを定義していることを示しています。いくつかの仮定の下で調整されます。 P-objective、またはPILCRO for Pixel-wise Importance Landscape Curvature Regularized Objectiveを導出します。これは、選択されたアーキテクチャではなく、データに条件付けられた滑らかで曲率の低い重要度のランドスケープを生成する重み構成を優先する単純な正規化手法です。広範な実験を通じて、一般的なコンピュータービジョン分類設定の元の対応物と比較して、一般的なコンピュータービジョンネットワークのP正規化バージョンは、重要性が横ばいで、トレーニングが速く、精度が高く、テスト時のノイズに対してより堅牢であることをさらに示しています。

Estimation of high frequency nutrient concentrations from water quality surrogates using machine learning methods

機械学習法を用いた水質代用物からの高頻度栄養素濃度の推定

著者:María Castrillo, Álvaro López García
URL:http://arxiv.org/abs/2001.09695v1

この論文の概要(機械翻訳による和訳)
継続的な高周波水質モニタリングは、水管理をサポートするための重要なタスクになりつつあります。センサー技術の進歩にもかかわらず、特定の変数をその場でリアルタイムで簡単におよび/または経済的に監視することはできません。これらの場合、代理指標を使用して、データ駆動型モデルによる推定を行うことができます。この作業では、一般的に現場で測定される変数を代理として使用して、農村集水域および都市集水域の栄養素の濃度を推定し、機械学習モデル、特にランダムフォレストを使用します。結果は、同数のサロゲートを使用した線形モデリングの結果と比較され、最大60.1%の二乗平均誤差(RMSE)の削減が得られます。最大7つのサロゲートセンサーを含めることによる利益が計算され、それぞれの集水域に4つ以上のセンサーを追加してもエラー改善の観点からは価値がないと結論付けられました。

Feature selection in machine learning: Rényi min-entropy vs Shannon entropy

機械学習における特徴選択:Rényi最小エントロピーとシャノンエントロピー

著者:Catuscia Palamidessi, Marco Romanelli
URL:http://arxiv.org/abs/2001.09654v1

この論文の概要(機械翻訳による和訳)
機械学習のコンテキストでの機能選択は、高度に予測可能な機能を、無関係または冗長である可能性のある機能から分離するプロセスです。予測力は特徴とラベルの間の相関、つまり相互情報に由来するため、情報理論はこのタスクの有用な概念として認識されています。文献の特徴選択のための多くのアルゴリズムは、シャノンエントロピーベースの相互情報を採用しています。この論文では、代わりにR ‘enyi min-entropyを使用する可能性を探ります。特に、セキュリティとプライバシーの分野で最近採用され、ベイズエラーに厳密に関連する条件付きR ‘enyimin-エントロピーの概念に基づくアルゴリズムを提案します。 R ‘enyiベースのアルゴリズムが対応するシャノンベースのアルゴリズムよりも優れたパフォーマンスを発揮するデータセットと、状況が逆転するデータセットを構築できることを示すという意味で、2つのアプローチが一般的でないことを証明します。ただし、実際には、実際のデータのデータセットを検討する場合、R ‘enyiベースのアルゴリズムは他のアルゴリズムよりも優れている傾向があるようです。 BASEHOCK、SEMEION、およびGISETTEdatasetsでいくつかの実験を実施しており、それらすべてで、R ‘enyiベースのアルゴリズムがより良い結果を与えることが実際に観察されています。

Performance Analysis and Comparison of Machine and Deep Learning Algorithms for IoT Data Classification

IoTデータ分類のための機械および深層学習アルゴリズムのパフォーマンス分析と比較

著者:Meysam Vakili, Mohammad Ghamsari, Masoumeh Rezaei
URL:http://arxiv.org/abs/2001.09636v1

この論文の概要(機械翻訳による和訳)
近年、新興テクノロジーとしてのモノのインターネット(IoT)の成長は信じられないほどです。 IoTドメイン内のネットワーク対応デバイスの数は劇的に増加しており、電子データの大量生産につながっています。これらのデータには、科学、産業、ビジネス、社会生活など、さまざまな分野で使用できる貴重な情報が含まれています。この情報を抽出して分析し、IoTシステムをスマートにするために、唯一の選択肢は人工知能(AI)の世界に入り、機械学習と深層学習の技術を活用することです。このホワイトペーパーでは、6つのIoT関連データセットを使用して、分類タスク用の11の一般的なマシンおよび深層学習アルゴリズムのパフォーマンスを評価します。これらのアルゴリズムは、精度、再現率、f1スコア、精度、実行時間、ROC-AUCスコア、混同マトリックスなど、いくつかのパフォーマンス評価指標に従って比較されます。開発されたモデルの収束速度を評価するために、特定の実験も行われます。包括的な実験により、すべてのパフォーマンスメトリックを考慮すると、ランダムフォレストは他の機械学習モデルよりも優れたパフォーマンスを発揮し、深層学習モデルの中でも、ANNとCNNはより興味深い結果を達成したことが示されました。

A Novel Generative Neural Approach for InSAR Joint Phase Filtering and Coherence Estimation

InSAR結合位相フィルタリングとコヒーレンス推定のための新しい生成ニューラルアプローチ

著者:Subhayan Mukherjee, Aaron Zimmer, Xinyao Sun, Parwant Ghuman, Irene Cheng
URL:http://arxiv.org/abs/2001.09631v1

この論文の概要(機械翻訳による和訳)
大気、地形、地面の不安定性などの地球の物理的特性は、その後の干渉合成開口レーダー(InSAR)画像で数十億の位相測定値(ピクセル)を区別することで決定できます。各ピクセルの品質(コヒーレンス)は、完全な情報(1)から完全なノイズ(0)まで変化する可能性があり、情報を含むピクセルのフィルタリングとともに定量化する必要があります。したがって、位相フィルタリングは、InSARのデジタル標高モデル(DEM)生産パイプラインにとって重要です。これは、空間的不整合(残留)を除去し、その後のアンラッピングを大幅に改善するためです。効果的かつ効率的な自動処理により手動の品質管理が不要になった場合、利用可能なInSARデータ量の最近の急増により、いくつかの地理的地域での広域監視(WAM)が促進されます。並列パターンコンピューティングアーキテクチャの進化と、視覚パターン認識で人間のパフォーマンスに匹敵するたたみ込みニューラルネットワーク(CNN)により、このアプローチはWAMのInSAR位相フィルタリングに理想的ですが、未だに未踏のままです。フェーズフィルタリングとコヒーレンス推定を結合するためのCNNベースの生成モデルである「GenInSAR」を提案します。衛星およびシミュレートされたInSAR画像を使用して、5つのアルゴリズムよりもGenInSARの全体的な優れたパフォーマンスを定性的に、および位相とコヒーレンスの2乗平均誤差、残差低減率、位相余弦誤差を使用して定量的に示します。

Variance Reduction with Sparse Gradients

スパース勾配による分散の削減

著者:Melih Elibol, Lihua Lei, Michael I. Jordan
URL:http://arxiv.org/abs/2001.09623v1

この論文の概要(機械翻訳による和訳)
SVRGやSpiderBoostなどの分散減少法では、大小のバッチ勾配の混合を使用して、確率論的勾配の分散を低減します。これらの方法の計算コストを削減するために、新しいスパース性演算子を導入しました:random-top-k演算子。 Ouroperatorは、top-k演算子とランダム化された座標降下演算子を組み合わせることにより、さまざまなアプリケーションで示される勾配の希薄性を推定することにより、計算の複雑さを軽減します。この演算子を使用すると、大規模なバッチ勾配は、分散の削減以上の利点を提供します。勾配のスパース性の信頼できる推定値です。理論的には、我々のアルゴリズムは少なくとも最良のアルゴリズム(SpiderBoost)と同等であり、random-top-k演算子が勾配スパース性をキャプチャするたびにパフォーマンスがさらに向上します。経験的に、私たちのアルゴリズムは、画像分類、自然言語処理、スパース行列因数分解などのさまざまなタスクでさまざまなモデルを使用して、SpiderBoostよりも一貫して優れています。また、単純な勾配エントロピー計算によってアルゴリズムの背後にある直感をサポートする経験的証拠を提供します。これは、反復ごとに勾配のスパース性を定量化するのに役立ちます。

A Primer on Domain Adaptation

ドメイン適応の入門書

著者:Pirmin Lemberger, Ivan Panico
URL:http://arxiv.org/abs/2001.09994v1

この論文の概要(機械翻訳による和訳)
標準的な教師あり機械学習では、アルゴリズムのトレーニングに使用されるソースサンプルの分布が、予測を行うことになっているターゲットサンプルの分布と同じであると想定しています。ただし、データサイエンティストが確認するように、これは実際にはほとんどありません。このような状況に対処する統計的および数値的手法のセットは、ドメイン適応と呼ばれ、長く豊かな歴史を持つ分野です。しかし、利用可能な方法が無数にあり、明確で普遍的に受け入れられている用語が不足しているため、このトピックは新規参入者にとってはかなり困難なものになる可能性があります。 4つの重要な特別なケース:(1) emph {prior shift}、ターゲットでの実際の分布を知らずにラベルに従ってトレーニングサンプルが選択された状況、(2) emph {covariate shift}トレーニングサンプルは機能に応じて選択されましたが、選択バイアスがあります。(3) emph {コンセプトシフト}ここで、機能へのラベルの依存はソースとターゲットの間で異なり、最後になりましたが(4) emph {これは、ターゲット内のフィーチャがソースフィーチャに関して未知の歪みの影響を受けている状況を処理します。いずれの場合も、最初に直観を構築し、次に適切な数学的枠組みを提供し、最終的に実用的なアプリケーションを説明します。

Deep Graph Matching Consensus

ディープグラフマッチングコンセンサス

著者:Matthias Fey, Jan E. Lenssen, Christopher Morris, Jonathan Masci, Nils M. Kriege
URL:http://arxiv.org/abs/2001.09621v1

この論文の概要(機械翻訳による和訳)
この作業は、グラフ間の構造的対応を学習および改良するための2段階のニューラルアーキテクチャを示しています。最初に、グラフニューラルネットワークによって計算されたローカライズされたノード埋め込みを使用して、ノード間のソフトな対応の初期ランキングを取得します。次に、同期メッセージパッシングネットワークを使用して、ソフト通信を繰り返しランク付けし、グラフ間のローカル近傍で一致するコンセンサスに到達します。理論的および経験的に、メッセージパッシングスキームが、対応する近傍の十分に確立されたコンセンサスの尺度を計算し、それが反復再ランキングプロセスを導くために使用されることを示します。純粋にローカルでスパース性を認識したアーキテクチャは、大規模な現実世界の入力にうまく対応しながら、グローバルな通信を一貫して回復することができます。コンピュータービジョンの分野からの実世界のタスクと、知識グラフ間のエンティティの整合性に関する現在の最先端技術を改善するための手法の実用的な有効性を実証します。ソースコードは、https://github.com/rusty1s/deep-graph-matching-consensusで入手できます。

Data-Driven Prediction Model of Components Shift during Reflow Process in Surface Mount Technology

表面実装技術におけるリフロープロセス中のコンポーネントシフトのデータ駆動型予測モデル

著者:Irandokht Parviziomran, Shun Cao, Krishnaswami Srihari, Daehan Won
URL:http://arxiv.org/abs/2001.09619v1

この論文の概要(機械翻訳による和訳)
表面実装技術(SMT)では、はんだ付けされたパッドに取り付けられたコンポーネントは、リフロープロセス中に移動する可能性があります。この機能はセルフアライメントとして知られ、溶融はんだペーストの流体力学的挙動の結果です。この機能は、不正確なセルフアライメントがオーバーハング、トゥームストーンなどの欠陥を引き起こす一方、反対側では、希望する位置またはその近くでコンポーネントを完全に自己組み立てできるため、SMTでは重要です。この研究の目的は、回転だけでなくxおよびy方向のリフロー中のコンポーネントの動きを予測する機械学習モデルを開発することです。私たちの研究は、2つのステップで構成されています:(1)自己整合と、コンポーネントジオメトリ、パッドジオメトリなどを含むさまざまな要因との関係を明らかにするための実験データを調査します。(2)高度な機械学習予測モデルを適用して、コンポーネントの距離と方向を予測しますサポートベクトル回帰(SVR)、ニューラルネットワーク(NN)、およびランダムフォレスト回帰(RFR)を使用したシフト。その結果、RFRは、99%、99%、および96%の平均適合度、およびx、yのコンポーネントシフトの平均予測誤差13.47(um)、12.02(um)、および1.52(deg。)でコンポーネントシフトを予測できます、およびそれぞれ回転方向。この機能強化により、ピックアンドプレースマシンでのパラメーターの最適化が将来的に可能になり、最適な配置場所を制御し、自己整合によって引き起こされる本質的な欠陥を最小限に抑えることができます。

Optimization of Passive Chip Components Placement with Self-Alignment Effect for Advanced Surface Mounting Technology

高度な表面実装技術のための自己整合効果による受動チップ部品配置の最適化

著者:Irandokht Parviziomran, Shun Cao, Haeyong Yang, Seungbae Park, Daehan Won
URL:http://arxiv.org/abs/2001.09612v1

この論文の概要(機械翻訳による和訳)
表面実装技術(SMT)は、電子部品をはんだ印刷回路基板(PCB)に直接配置し、リフローはんだ付けプロセスを目的としてPCBに恒久的に取り付ける電子パッケージングの強化された方法です。リフロープロセスでは、堆積したはんだペーストが溶融し始めると、電子部品は最高の対称性を実現する方向に移動します。この動作は、潜在的な取り付けミスアライメントを修正できるため、セルフアライメントとして知られています。この研究では、サポートベクター回帰(SVR)とランダムフォレスト回帰(RFR)を含む2つの顕著な機械学習アルゴリズムが、(1)コンポーネントの自己整合、堆積したはんだペーストの状態、および配置機械加工パラメーター間の相関を診断する予測手法として提案されています(2 )リフロープロセスに入る前に、PCBin x、y、および回転方向の最終コンポーネント位置を予測します。予測結果に基づいて、初期段階で配置パラメーターを最適化するための非線形最適化モデル(NLP)が開発されます。その結果、RFRは予測モデルの適合性とエラーの範囲を超えています。最適化モデルは、6つのサンプルに対して実行されます。理想的な位置(つまり、パッドの中心)からのリフロープロセス後のコンポーネント位置からの最小ユークリッド距離は、モデルで定義された境界に関して25.57({ mu} m)として示されます。

Practical Fast Gradient Sign Attack against Mammographic Image Classifier

マンモグラフィ画像分類器に対する実用的な高速勾配サイン攻撃

著者:Ibrahim Yilmaz
URL:http://arxiv.org/abs/2001.09610v1

この論文の概要(機械翻訳による和訳)
人工知能(AI)は長年にわたって主要な研究のトピックでした。特に、ディープニューラルネットワーク(DNN)の出現により、これらの研究は非常に成功しています。今日、機械は人間よりも高速で正確な意思決定を行うことができます。機械学習(ML)技術の大きな発展のおかげで、MLは教育、医学、マルウェア検出、自動運転車などの多くの異なる分野で使用されています。 。攻撃者は、クリーンなデータを操作してML分類子をだまし、目的のターゲットを達成できます。たとえば、良性のサンプルは悪意のあるサンプルとして変更することも、悪意のあるサンプルを良性として変更することもできますが、この変更は人間の観察者には認識されません。これは、多くの経済的損失、または重傷、さらには死に至る可能性があります。このペーパーの背後にある動機は、この問題を強調し、意識を高めたいということです。したがって、敵対的な攻撃に対するマンモグラフィ画像分類のセキュリティギャップが示されます。マンモグラフィ画像を使用してモデルをトレーニングし、精度の観点からモデルのパフォーマンスを評価します。後で、元のデータセットをポイズニングし、モデルによって分類ミスされた敵対的なサンプルを生成します。次に、構造的類似性インデックス(SSIM)を使用して、クリーンな画像と敵対的な画像間の類似性を分析します。最後に、さまざまな中毒因子を使用することで、悪用の成功度を示します。

Generating Natural Adversarial Hyperspectral examples with a modified Wasserstein GAN

修正されたWasserstein GANを使用した自然な敵対ハイパースペクトルの例の生成

著者:Jean-Christophe Burnel, Kilian Fatras, Nicolas Courty
URL:http://arxiv.org/abs/2001.09993v1

この論文の概要(機械翻訳による和訳)
敵対者の例は、分類器の予測を欺く能力があるため、ホットなトピックです。このような例を作成するための2つの戦略があります。1つは攻撃された分類器の勾配を使用し、もう1つはclas-sifierの予測へのアクセスのみを必要とします。これは、分類器が完全に知られていない場合(ブラックボックスモデル)に特に魅力的です。この論文では、2番目のパラダイムに従って真のデータから自然な敵対的な例を生成できる新しい方法を提示します。 Generative Adversarial Networks(GANs)[5]に基づいて、真のデータの経験的分布を再重み付けして、分類器がad-versarial例を生成するように促します。リモートセンシングデータセットで敵対的なハイパースペクトルシグネチャを生成することにより、私たちの方法の概念実証を提供します。

Some Insights into Lifelong Reinforcement Learning Systems

生涯学習システムの洞察

著者:Changjian Li
URL:http://arxiv.org/abs/2001.09608v1

この論文の概要(機械翻訳による和訳)
生涯強化学習システムは、生涯にわたって環境とのトレイルアンドエラーの相互作用を通じて学習する能力を持つ学習システムです。この論文では、従来の強化学習パラダイムがこのタイプの学習システムのモデル化に失敗したことを示すためにいくつかの議論を行います。

Developing Multi-Task Recommendations with Long-Term Rewards via Policy Distilled Reinforcement Learning

ポリシー蒸留強化学習による長期報酬を伴うマルチタスク推奨の開発

著者:Xi Liu, Li Li, Ping-Chun Hsieh, Muhe Xie, Yong Ge, Rui Chen
URL:http://arxiv.org/abs/2001.09595v1

この論文の概要(機械翻訳による和訳)
オンライン製品とコンテンツの爆発的な成長に伴い、推奨技術は、情報過多を克服し、ユーザーエクスペリエンスを向上させ、ビジネス収益を高める効果的なツールと見なされています。近年、複数の関連する推奨タスクの長期的な報酬を同時に検討するという新しい要求事項を観察しました。長期的な報酬の検討は、ビジネスの収益と成長に強く結びついています。複数のタスクを同時に学習すると、一般に、マルチタスク学習での知識の共有により、個々のタスクのパフォーマンスが向上します。いくつかの既存の作品は、推薦における長期的な報酬を研究していますが、主に単一の推薦タスクに焦点を当てています。このペーパーでは、{ it PoDiRe}:推奨事項の長期的な報酬に対処し、同時に複数の推奨事項タスクを処理できる、 underline {po} lic underline {di} stilled underline {re}コマンドを提案します。この新しい推奨ソリューションは、深層強化学習と知識蒸留技術の融合に基づいており、さまざまなタスク間で知識共有を確立し、学習モデルのサイズを削減できます。結果として得られるモデルは、リアルタイム推奨サービスのパフォーマンスの向上と応答待ち時間の短縮を実現することが期待されています。世界最大の商用モバイルゲームプラットフォームの1つであるSamsung Game Launcherと共同で、数億の大規模な実データに関する包括的な実験的研究を実施します。いくつかの標準評価指標の観点から、当社のソリューションが多くの最先端の方法よりも優れていることを示しています。

Naive Exploration is Optimal for Online LQR

素朴な探査はオンラインLQRに最適です

著者:Max Simchowitz, Dylan J. Foster
URL:http://arxiv.org/abs/2001.09576v1

この論文の概要(機械翻訳による和訳)
真のシステムパラメータが不明な線形二次レギュレータのオンライン適応制御の問題を検討します。最適な後悔が$ widetilde { Theta}({ sqrt {d _ { mathbf {u}} ^ 2 d _ { mathbf {x}} T}})$としてスケーリングすることを示す新しい上限と下限を証明します。 $ T $はタイムステップの数、$ d _ { mathbf {u}} $は入力空間の次元、$ d _ { mathbf {x}} $はシステム状態の次元です。特に、下限は$ mathrm {poly}( log {} T)$-regretアルゴリズムの可能性を排除していますが、これは問題の明らかな強い凸性のために推測されています。 emph {certaintyequivalence control}のバリアント。学習者は、探索的ランダムノイズを注入しながら、システムの推定値に最適なコントローラーに従って制御入力を選択します。このアプローチは、Maniaらによって$ sqrt {T} $-後悔を達成することが示されました。 2019年、学習者がシステムマトリックスの推定値を継続的に調整する場合、この方法は最適な次元依存性も達成することを示しています。上限と下限の中心にあるのは、リカッティ方程式の摂動を制御するための新しいアプローチです。これを emph {self-bounding ODEmethod}と呼びます。このアプローチは、 emph {anystabilizable instance}を保持する後悔の上限を可能にし、単一の安定化コントローラーを除いてシステムの事前知識を必要とせず、自然な制御理論量でスケーリングします。

Heterogeneous Learning from Demonstration

デモンストレーションからの異種学習

著者:Rohan Paleja, Matthew Gombolay
URL:http://arxiv.org/abs/2001.09569v1

この論文の概要(機械翻訳による和訳)
人間とロボットの両方の強みを活用できる人間ロボットシステムの開発は、業界および研究全体にわたって予測される広範囲の影響のために非常に求められています。私たちは、ロボットが高度な自律性を持って行動できなければ、これらのシステムの真の可能性に達することはできず、手動のタスクやテレオペレーションの負担を軽減できると考えています。このレベルの自律性を実現するには、ロボットは人間のパートナーとスムーズに連携し、明示的なコマンドなしでニーズを推測できる必要があります。この推論では、ロボットがパートナーの不均一性を検出および分類できる必要があります。ベイジアン推論に基づいて不均一なデモンストレーションから学習するためのフレームワークを提案し、StarCraft IIからのゲームプレイの実世界のデータセットに対する一連のアプローチを評価します。この評価は、当社のベイジアンアプローチが従来の方法を最大12.8 $%$上回る可能性があるという証拠を提供します。

Comprehensive Analysis of Time Series Forecasting Using Neural Networks

ニューラルネットワークを使用した時系列予測の包括的な分析

著者:Manie Tadayon, Yumi Iwashita
URL:http://arxiv.org/abs/2001.09547v1

この論文の概要(機械翻訳による和訳)
時系列予測は最近多くの注目を集めています。これは、多くの実世界の現象を時系列としてモデル化できるためです。大量のデータとコンピューターの処理能力の最近の進歩により、研究者はニューラルネットワークなどのより高度な機械学習アルゴリズムを開発して、時系列データを予測できます。この論文では、動的測定を使用して時系列データを予測するために、さまざまなニューラルネットワークアーキテクチャを提案します。さらに、予測のために静的測定と動的測定を組み合わせる方法に関するさまざまなアーキテクチャを紹介します。また、予測精度の異常検出やクラスタリングなどの手法を実行することの重要性についても調査します。我々の結果は、クラスタリングが全体的な予測時間を改善し、ニューラルネットワークの予測性能を改善できることを示しています。さらに、機能ベースのクラスタリングが、速度と効率の点で距離ベースのクラスタリングよりも優れていることを示します。最後に、我々の結果は、ターゲット変数を予測するためにさらに予測変数を追加しても、予測精度が必ずしも向上しないことを示しています。

分野/キーワード:

論文ナビに登録すると・・・
①最新情報をメールでお届け!
  • 話題のニュース一覧
  • 注目のプレスリリース
  • 論文解説・最近のイベント
②論文解説記事の投稿
  • ご自身の論文の解説
  • 読んだ論文のメモ
  • 研究に関する情報のシェア
③セミナー情報の宣伝
  • ご自身が主催するイベント情報を投稿してシェア
  • ユーザーで作るセミナー日程まとめに参加
【併せて読みたい関連記事】
X
- Enter Your Location -
- or -
パスワード再発行
お気に入り
  • Total (0)
0