機械学習分野論文まとめ【2020年01月28日arXiv公開】

アブストまとめ
Like+1
お気に入り

2020年01月28日に発表された機械学習分野の論文47本のAbstractをまとめて和訳しました。

この記事の見出し

Towards a Human-like Open-Domain Chatbot

人間に似たオープンドメインチャットボットに向けて

著者:Daniel Adiwardana, Minh-Thang Luong, David R. So, Jamie Hall, Noah Fiedel, Romal Thoppilan, Zi Yang, Apoorv Kulshreshtha, Gaurav Nemade, Yifeng Lu, Quoc V. Le
URL:http://arxiv.org/abs/2001.09977v1

この論文の概要(機械翻訳による和訳)
Meenaを公開します。これは、パブリックドメインのソーシャルメディアの会話からデータマイニングおよびフィルター処理されたエンドツーエンドのマルチターンオープンドメインチャットボットです。この2.6Bパラメータニューラルネットワークは、複雑さを最小限に抑えるようにトレーニングされています。これは、マルチターンの会話品質の人間の判断と比較する自動メトリックです。この判断をキャプチャするために、私たちは良好な会話の重要な要素をキャプチャする感度と特異度平均(SSA)と呼ばれる人間の評価指標を提案します。興味深いことに、我々の実験は、複雑さとSSAの間に強い相関関係があることを示しています。エンドツーエンドで最適なパープレキシティがSSAでトレーニングされたMeenascores(マルチターン評価で72%)であるという事実は、パープレキシティをより適切に最適化できる場合、86%の人間レベルのSSAが潜在的に到達可能であることを示唆しています。 Meena(フィルタリングメカニズムとtuneddecodingを使用)のスコアは79%SSAで、次に評価したスコアリングチャットボットよりも23%高くなりました。

Reinforcement Learning-based Autoscaling of Workflows in the Cloud: A Survey

クラウド内のワークフローの強化学習ベースの自動スケーリング:調査

著者:Yisel Garí, David A. Monge, Elina Pacini, Cristian Mateos, Carlos García Garino
URL:http://arxiv.org/abs/2001.09957v1

この論文の概要(機械翻訳による和訳)
強化学習(RL)は、複雑な不確実な環境で意思決定の問題を自動的に解決する大きな可能性を示しています。基本的に、RLは確率的行動の環境での相互作用を通じて学習することを可能にする計算アプローチを提案し、エージェントはいくつかの累積的な短期的および長期的な報酬を最大化するためのアクションを取ります。最も印象的な結果のいくつかは、エージェントがGoやStarcraft 2などのゲームで超人的なパフォーマンスを示したゲーム理論で示されており、クラウドコンピューティングを含む他の多くのドメインで採用されました。与えられた最適化基準に従ったワークフローの。これは意思決定の問題であり、計算リソースをいつ、どのようにスケールアップ/ダウンするかを確立する必要があります。そして、今後の処理ワークロードにそれらを割り当てる方法。動的で不確実な環境であるクラウドの最適化基準を考慮して、このようなアクションを実行する必要があります。これにより、多くの作業がRLをクラウドの自動スケーリング問題に適用します。この作業では、主要会場からの提案を徹底的に調査し、提案された分類法に基づいてそれらを均一に比較します。また、未解決の問題について議論し、この分野での将来の研究の展望を提供します。

Near real-time map building with multi-class image set labelling and classification of road conditions using convolutional neural networks

畳み込みニューラルネットワークを使用したマルチクラス画像セットラベリングと道路状況の分類によるほぼリアルタイムのマップ構築

著者:Sheela Ramanna, Cenker Sengoz, Scott Kehler, Dat Pham
URL:http://arxiv.org/abs/2001.09947v1

この論文の概要(機械翻訳による和訳)
天気は、輸送と交通安全に影響を与える重要な要素です。このホワイトペーパーでは、最先端の畳み込みニューラルネットワークを活用して、北米全域にある道路カメラと高速道路カメラで撮影した画像にラベルを付けます。道路状況によって画像を分類するために、道路カメラのスナップショットが複数の深層学習フレームワークを使用した実験で使用されました。これらの実験のトレーニングデータでは、乾燥、湿潤、雪/氷、貧弱、オフラインのラベルが付いた画像を使用しました。実験では、この問題に対する適合性を評価するために、6つの畳み込みニューラルネットワーク(VGG-16、ResNet50、Xception、InceptionResNetV2、EfficientNet-B0、およびEfficientNet-B4)のさまざまな構成をテストしました。精度、精度、および再現率は、各フレームワーク構成で測定されました。さらに、トレーニングセットは、全体のサイズと個々のクラスのサイズの両方で変化しました。最終的なトレーニングセットには、前述の5つのクラスを使用してラベル付けされた47,000枚の画像が含まれていました。 EfficientNet-B4frameworkはこの問題に最も適していることがわかり、検証精度90.6%を達成しましたが、EfficientNet-B0は実行時間の半分で90.3%の精度を達成しました。転送学習を備えたVGG-16は、このプロジェクト全体で、限られたハードウェアリソースを使用したデータ取得および擬似ラベル付けに非常に役立つことが確認されました。その後、EfficientNet-B4フレームワークは、リアルタイムの実稼働環境に配置され、そこでは画像を継続的にリアルタイムで分類することができました。次に、分類された画像を使用して、北米全域のさまざまなカメラ位置でのリアルタイムの道路状況を示す地図を作成しました。これらのフレームワークの選択と分析では、リアルタイムのマップ構築機能の固有の要件を考慮します。これらのフレームワークを使用した半自動化されたデータセットのラベル付けプロセスの詳細な分析も、このホワイトペーパーで説明します。

A Precision Medicine Approach to Develop and Internally Validate Optimal Exercise and Weight Loss Treatments for Overweight and Obese Adults with Knee Osteoarthritis

変形性膝関節症の過体重および肥満の成人に対する最適な運動および減量治療を開発および内部検証するための精密医学アプローチ

著者:Xiaotong Jiang, Amanda E. Nelson, Rebecca J. Cleveland, Daniel P. Beavers, Todd A. Schwartz, Liubov Arbeeva, Carolina Alvarez, Leigh F. Callahan, Stephen Messier, Richard Loeser, Michael R. Kosorok
URL:http://arxiv.org/abs/2001.09930v1

この論文の概要(機械翻訳による和訳)
運動の参加者(E)、食事による減量(D)、および変形性膝関節症(KOA)のD + Etrialの期待される結果を最大化するための最適な治療レジメンを決定するための精密医療アプローチを提案しました。 Intensive Diet and Exercisefor Arthritis(IDEA)トライアルの343人の参加者からのデータを使用して、24の機械学習モデルを適用して、SF-36物理成分コア、体重減少、WOMAC疼痛/機能/剛性スコア、圧縮性の7つの結果に関する個別の治療ルールを開発しました力、およびIL-6。最適なモデルは、将来の参加者が最適な単一の固定治療モデルと比較して推定決定ルールに従う場合の結果の改善を示すジャックナイフ値関数推定に基づいて選択されました。複数の結果のランダムフォレストは、WOMACの結果の最適なモデルでした。その他の結果については、リストベースのモデルが最適でした。たとえば、体重減少の推定最適決定ルールは、ベースライン重量が109.35 kgを超えず、胴囲が90.25 cmを超える参加者にD + Einterventionを割り当て、心臓発作の履歴を持っている参加者を除く他のすべての参加者にDを割り当てます。将来の参加者に適用された場合、減量の最適なルールは、18か月で平均減量を11.2 kgに増加させると推定されますが、すべてがD + E(p = 0.01)を受けた場合は9.8 kgでした。 IDEAは、ほとんどの参加者にとってD + E介入が最適であるが、参加者のサブグループは、2つの結果について食事だけでより多くの恩恵を受ける可能性が高いという証拠があった。

Rotation, Translation, and Cropping for Zero-Shot Generalization

ゼロショット一般化のための回転、変換、およびトリミング

著者:Chang Ye, Ahmed Khalifa, Philip Bontrager, Julian Togelius
URL:http://arxiv.org/abs/2001.09908v1

この論文の概要(機械翻訳による和訳)
Deep Reinforcement Learning(DRL)は、視覚入力、特にさまざまなゲームのあるドメインで印象的なパフォーマンスを示しています。ただし、エージェントは通常、固定環境でトレーニングされます。固定数のレベル。ますます多くの証拠が、これらの訓練されたモデルが、訓練された環境のわずかな変動に一般化できないことを示唆しています。この論文は、一般化の欠如が部分的に入力表現によるものであるという仮説を進め、回転、トリミング、および翻訳が一般性をどのように高めることができるかを調査します。切り取り、翻訳、回転した観測は、2次元のアーケードゲームの見えないレベルでより一般化できることを示します。エージェントの一般性は、人間が設計した一連のレベルで評価されます。

Predicting Yield Performance of Parents in Plant Breeding: A Neural Collaborative Filtering Approach

植物育種における親の収量パフォーマンスの予測:神経協調フィルタリングアプローチ

著者:Saeed Khaki, Zahra Khalilzadeh, Lizhi Wang
URL:http://arxiv.org/abs/2001.09902v1

この論文の概要(機械翻訳による和訳)
実験的なトウモロコシハイブリッドは、2つの親、いわゆる近交系とテスターを一緒に交配することにより、植物育種プログラムで作成されます。親の可能な交差の組み合わせの総数は多く、時間と予算の限られたリソースのために可能なすべての交差の組み合わせをテストすることは非現実的であるため、交差のための最良の親の組み合わせの識別は困難である。 2020年のシンジェンタクロップチャレンジで、シンジェンタは、2016年から2018年の間に280の場所に植えられた496のテスターと593の同系交配の合計交配の約4%の過去の収量パフォーマンスを記録したいくつかの大きなデータセットをリリースし、参加者に同系交配の交配パフォーマンスの予測を求めましたそして、他の近交系およびテスターの交配から収集された過去の収量データに基づいて植え付けられていないテスター。本論文では、この問題を解決するための行列因子分解法とニューラルネットワークのアンサンブルである協調フィルタリング法を提示します。計算結果から、提案されたモデルはLASSO、ランダムフォレスト(RF)、およびニューラルネットワークなどの他のモデルを大幅に上回ることが示唆されました。提示された方法と結果は、2020年シンジェンタクロップチャレンジ内で作成されました。

Estimating heterogeneous treatment effects with right-censored data via causal survival forests

因果サバイバルフォレストを介した右打ち切りデータによる不均一な治療効果の推定

著者:Yifan Cui, Michael R. Kosorok, Stefan Wager, Ruoqing Zhu
URL:http://arxiv.org/abs/2001.09887v1

この論文の概要(機械翻訳による和訳)
観察研究では、ランダムな森林を介した不均一な治療効果の推定に関する急成長している文献があります。ただし、右打ち切りの生存データに利用できるアプローチはほとんどありません。臨床試験では、右打ち切りの生存データに頻繁に遭遇します。治療と生存結果との因果関係を定量化することは非常に興味深い。ランダムフォレストは、統計的推定に対する堅牢でノンパラメトリックなアプローチを提供する。さらに、最近の開発により、森林ベースの手法で、推定される不均一な処理効果の不確実性を定量化できます。観察研究から治療効果を推定することを直接目標とする因果サバイバルフォレストを提案します。提案された推定量の一貫性と漸近正規性を確立し、推定治療効果の有効な信頼区間を可能にする漸近分散の推定量を提供します。私たちのアプローチのパフォーマンスは、広範なシミュレーションとHIV研究からのデータを介して実証されています。

Bayesian nonparametric shared multi-sequence time series segmentation

ベイジアンノンパラメトリック共有マルチシーケンス時系列セグメンテーション

著者:Olga Mikheeva, Ieva Kazlauskaite, Hedvig Kjellström, Carl Henrik Ek
URL:http://arxiv.org/abs/2001.09886v1

この論文の概要(機械翻訳による和訳)
この論文では、ベイジアンノンパラメトリックのツールを使用して時系列データをセグメント化する方法を紹介します。時系列データのセットを一時的なセグメント化して代表的な静止セグメントにするタスクを検討します。ガウス過程(GP)事前分布を使用して、基礎となる定常セグメントの特性に関する知識を課し、ノンパラメトリック分布を使用して、セグメント長の事前分布に関して定式化されたシーケンスをそのようなセグメントに分割します。セグメンテーションが与えられると、モデルは、混合成分がGPの共分散関数を使用して記述されるガウス混合モデルのバリアントと見なすことができます。私たちは、合成データおよび心拍のリアルタイムの時系列データに対するモデルの有効性を実証します。ここでは、心拍の記録を健康的な異常な心音に対応するクラスに分類するために、指標となる種類のビートをセグメント化することがタスクです。

The POLAR Framework: Polar Opposites Enable Interpretability of Pre-Trained Word Embeddings

POLARフレームワーク:Polar Oppositesにより、事前にトレーニングされたWord埋め込みの解釈が可能

著者:Binny Mathew, Sandipan Sikdar, Florian Lemmerich, Markus Strohmaier
URL:http://arxiv.org/abs/2001.09876v1

この論文の概要(機械翻訳による和訳)
POLARを導入します。これは、意味の差異を採用することで、事前に訓練された単語の埋め込みに解釈可能性を追加するフレームワークです。セマンティックディファレンシャルは、2つの極の正反対のスケール(コールド-ホット、ソフト-ハード)でスケールでその位置を分析することにより、ワードのセマンティクスを測定するための心理測定構成です。私たちのアプローチの核となる考え方は、既存の事前学習済みの単語埋め込みを、セマンティック差分を介して、そのような極の対極によって定義される解釈可能な次元を持つ新しい「極」空間に変換することです。オラクル、すなわち外部ソースによって。さまざまなダウンストリームタスクにフレームワークを展開することにより、フレームワークの有効性を実証します。このタスクでは、解釈可能な単語の埋め込みにより、元の単語の埋め込みに匹敵するパフォーマンスが得られます。また、フレームワークによって選択された解釈可能な次元が人間の判断と一致することを示します。一緒に、これらの結果は、パフォーマンスを損なうことなく、語の埋め込みに解釈可能性を追加できることを示しています。私たちの仕事は、事前に訓練された単語埋め込みの解釈に興味のある研究者やエンジニアに関連しています。

Exploiting Unsupervised Inputs for Accurate Few-Shot Classification

正確な少数ショット分類のための教師なし入力の活用

著者:Yuqing Hu, Vincent Gripon, Stéphane Pateux
URL:http://arxiv.org/abs/2001.09849v1

この論文の概要(機械翻訳による和訳)
少数ショット分類の目的は、ラベル付けされた少数の例だけでクラスを区別できるモデルを学習することです。ほとんどの文献は、一度に1つの未知の入力にラベルを付ける問題を考慮しています。代わりに、ラベルのない入力のバッチを結合して独立して処理しない設定を検討することは有益です。この論文では、3つのレベルの情報を活用できる方法を提案します:a)汎用データセットで事前にトレーニングされた特徴抽出器、b)区別するクラスのラベルの少ない例、およびc)その他の利用可能なラベルのない入力a)で最先端のアプローチを使用する場合、b)とc)を一緒に実行するための単純化されたグラフ畳み込みの使用を導入します。提案されたモデルは、標準の数発ビジョン分類データセットで利用可能な代替物と比較して、6〜11ドルの増加で最先端の精度に達します。

Polygames: Improved Zero Learning

ポリゲーム:ゼロ学習の改善

著者:Tristan Cazenave, Yen-Chi Chen, Guan-Wei Chen, Shi-Yu Chen, Xian-Dong Chiu, Julien Dehos, Maria Elsa, Qucheng Gong, Hengyuan Hu, Vasil Khalidov, Cheng-Ling Li, Hsin-I Lin, Yu-Jin Lin, Xavier Martinet, Vegard Mella, Jeremy Rapin, Baptiste Roziere, Gabriel Synnaeve, Fabien Teytaud, Olivier Teytaud, Shi-Cheng Ye, Yi-Jun Ye, Shi-Jim Yen, Sergey Zagoruyko
URL:http://arxiv.org/abs/2001.09832v1

この論文の概要(機械翻訳による和訳)
DeepMindのAlphaZero以来、ゼロ学習はすぐに多くのボードゲームの最先端の方法になりました。完全に畳み込み構造(完全に接続された層なし)を使用して改善できます。このようなアーキテクチャとグローバルプーリングを使用して、ボードサイズに関係なくボットを作成できます。トレーニング中に最適なチェックポイントを追跡し、それらに対してチェックすることにより、トレーニングをより堅牢にすることができます。これらの機能を使用して、ゲームのライブラリとチェックポイントを備えた、ゼロ学習のためのフレームワークであるPolygamesをリリースします。 19×19のHexのゲームで強い人間と対戦しましたが、これは学習なしでは手に負えないとしばしば言われました。ハバナで。また、TAAI大会でいくつかの優勝を獲得しました。

Uncertainty-based Modulation for Lifelong Learning

生涯学習のための不確実性ベースの変調

著者:Andrew Brna, Ryan Brown, Patrick Connolly, Stephen Simons, Renee Shimizu, Mario Aguilar-Simon
URL:http://arxiv.org/abs/2001.09822v1

この論文の概要(機械翻訳による和訳)
継続的な生涯学習が可能なインテリジェントエージェント向けの機械学習アルゴリズムの作成は、動的環境の実際のシステムに展開されるアルゴリズムの重要な目標です。ここでは、Stephen Grossbergの画期的なAdaptiveResonance Theoryの提案を統合し拡張する、人間の脳の神経調節機構に触発されたアルゴリズムを紹介します。具体的には、不確実性の概念に基づいて構築され、一連の神経調節メカニズムを採用して、自己監視型学習とワンショット学習を含む継続的な学習を可能にします。壊滅的な忘却を伴わない安定した学習を実証する一連のベンチマーク実験で、アルゴリズムコンポーネントが評価されました。また、環境とエージェントの動作が学習プロセスを制約およびガイドする閉ループ方式でこれらのシステムを開発する重要な役割を示します。そのために、アルゴリズムを具現化されたシミュレートドローンエージェントに統合しました。実験により、アルゴリズムは、壊滅的な忘却を伴わずに、仮想環境で高い分類精度(94%を超える)で新しいタスクを継続的に学習し、条件を変更できることが示されています。このアルゴリズムは、最先端の検出および特徴抽出アルゴリズムからの高次元入力を受け入れ、既存のシステムへの柔軟な追加を可能にします。また、アルゴリズムに新しい知識を求め、より広範な神経調節プロセスを採用するメカニズムを組み込むことに焦点を当てた将来の開発努力についても説明します。

One Explanation Does Not Fit All: The Promise of Interactive Explanations for Machine Learning Transparency

1つの説明がすべてに当てはまるわけではない:機械学習の透明性のためのインタラクティブな説明の約束

著者:Kacper Sokol, Peter Flach
URL:http://arxiv.org/abs/2001.09734v1

この論文の概要(機械翻訳による和訳)
機械学習アルゴリズムに基づく予測システムの透明性の必要性は、業界での増え続ける増殖の結果として生じています。ブラックボックスアルゴリズムの予測が人事に影響を与えるときはいつでも、これらのアルゴリズムの内部動作を精査し、システムエンジニア、システムのオペレーター、ケースが決定されている個人などの関連する利害関係者にその決定を説明する必要があります。さまざまな解釈可能性と説明可能性の方法が利用可能ですが、それらはいずれも、関係者が必要とする可能性のあるすべての多様な期待と競合する目的を満たすことができる万能薬ではありません。この課題では、対比的な説明の例を使用して、ブラックボックスシステムの透明性を向上させるInteractiveMachine Learningの約束について説明します。これは、解釈可能な機械学習の最先端のアプローチです。具体的には、条件文を対話的に調整して反事実的な説明をパーソナライズする方法を示し、フォローアップの「What if?」質問。このタイプのシステムを構築、展開、および提示した経験により、インタラクティブな説明者の開発をガイドするために使用できる、望ましいプロパティと潜在的な制限をリストできました。対話の媒体、つまりさまざまな通信チャネルで構成されるユーザーインターフェイスをカスタマイズすることで、パーソナライズの印象を与えることができますが、説明自体とその内容を調整することがより重要であると主張します。この目的のために、説明の幅、範囲、コンテキスト、目的、ターゲットなどのプロパティを考慮する必要があります。さらに、その制限と注意事項について明示的に説明する必要があります…

DP-CGAN: Differentially Private Synthetic Data and Label Generation

DP-CGAN:差分的にプライベートな合成データとラベル生成

著者:Reihaneh Torkzadehmahani, Peter Kairouz, Benedict Paten
URL:http://arxiv.org/abs/2001.09700v1

この論文の概要(機械翻訳による和訳)
Generative Adversarial Networks(GAN)は、画像を含む合成データを生成するための有名なモデルの1つです。特に、公開されていないため元の機密データセットを使用できない研究コミュニティ向けです。この分野の主な課題の1つは、GANモデルのトレーニングに参加する個人のプライバシーを保護することです。この課題に対処するために、トレーニングデータセットのプライバシーを保持しながらモデルのパフォーマンスを向上させる、新しいクリッピングおよび摂動戦略に基づく差分プライベート条件付きGAN(DP-CGAN)トレーニングフレームワークを導入します。 DP-CGANは、合成データと対応するラベルの両方を生成し、最近導入されたRenyi差分プライバシー会計士を活用して、使用済みのプライバシー予算を追跡します。実験結果は、DP-CGANが、微分プライバシーの1桁のイプシロンパラメーターを使用して、MNISTデータセットで視覚的および経験的に有望な結果を生成できることを示しています。

¶ILCRO: Making Importance Landscapes Flat Again

¶ILCRO:重要度のランドスケープを再びフラットにする

著者:Vincent Moens, Simiao Yu, Gholamreza Salimi-Khorshidi
URL:http://arxiv.org/abs/2001.09696v1

この論文の概要(機械翻訳による和訳)
畳み込みニューラルネットワークは、画像分類、オブジェクト検出、シーケンスモデリングなど、多数のタスクで大きな成功を収めています。一般に、そのようなニューラルネットワークは並進不変であると想定されます。つまり、入力画像内の位置とは無関係に特定の特徴を検出できるということです。これは、ネットワークが限られた数のレイヤークラスで構成され、画像が非常に単純な単純な場合に当てはまりますが、一般的な最先端のネットワークを備えた複雑な画像は、通常、この特性を享受できません。このホワイトペーパーでは、既存の畳み込みアーキテクチャのほとんどが、初​​期化時に、トレーニング中またはテスト時にも画像のさまざまな場所に対応する能力を制限する特定の機能重要性ランドスケープを定義していることを示しています。いくつかの仮定の下で調整されます。 P-objective、またはPILCRO for Pixel-wise Importance Landscape Curvature Regularized Objectiveを導出します。これは、選択されたアーキテクチャではなく、データに条件付けられた滑らかで曲率の低い重要度のランドスケープを生成する重み構成を優先する単純な正規化手法です。広範な実験を通じて、一般的なコンピュータービジョン分類設定の元の対応物と比較して、一般的なコンピュータービジョンネットワークのP正規化バージョンは、重要性が横ばいで、トレーニングが速く、精度が高く、テスト時のノイズに対してより堅牢であることをさらに示しています。

Estimation of high frequency nutrient concentrations from water quality surrogates using machine learning methods

機械学習法を用いた水質代用物からの高頻度栄養素濃度の推定

著者:María Castrillo, Álvaro López García
URL:http://arxiv.org/abs/2001.09695v1

この論文の概要(機械翻訳による和訳)
継続的な高周波水質モニタリングは、水管理をサポートするための重要なタスクになりつつあります。センサー技術の進歩にもかかわらず、特定の変数をその場でリアルタイムで簡単におよび/または経済的に監視することはできません。これらの場合、代理指標を使用して、データ駆動型モデルによる推定を行うことができます。この作業では、一般的に現場で測定される変数を代理として使用して、農村集水域および都市集水域の栄養素の濃度を推定し、機械学習モデル、特にランダムフォレストを使用します。結果は、同数のサロゲートを使用した線形モデリングの結果と比較され、最大60.1%の二乗平均誤差(RMSE)の削減が得られます。最大7つのサロゲートセンサーを含めることによる利益が計算され、それぞれの集水域に4つ以上のセンサーを追加してもエラー改善の観点からは価値がないと結論付けられました。

Feature selection in machine learning: Rényi min-entropy vs Shannon entropy

機械学習における特徴選択:Rényi最小エントロピーとシャノンエントロピー

著者:Catuscia Palamidessi, Marco Romanelli
URL:http://arxiv.org/abs/2001.09654v1

この論文の概要(機械翻訳による和訳)
機械学習のコンテキストでの機能選択は、高度に予測可能な機能を、無関係または冗長である可能性のある機能から分離するプロセスです。予測力は特徴とラベルの間の相関、つまり相互情報に由来するため、情報理論はこのタスクの有用な概念として認識されています。文献の特徴選択のための多くのアルゴリズムは、シャノンエントロピーベースの相互情報を採用しています。この論文では、代わりにR ‘enyi min-entropyを使用する可能性を探ります。特に、セキュリティとプライバシーの分野で最近採用され、ベイズエラーに厳密に関連する条件付きR ‘enyimin-エントロピーの概念に基づくアルゴリズムを提案します。 R ‘enyiベースのアルゴリズムが対応するシャノンベースのアルゴリズムよりも優れたパフォーマンスを発揮するデータセットと、状況が逆転するデータセットを構築できることを示すという意味で、2つのアプローチが一般的でないことを証明します。ただし、実際には、実際のデータのデータセットを検討する場合、R ‘enyiベースのアルゴリズムは他のアルゴリズムよりも優れている傾向があるようです。 BASEHOCK、SEMEION、およびGISETTEdatasetsでいくつかの実験を実施しましたが、それらすべてで、R ‘enyiベースのアルゴリズムがより良い結果を与えることを実際に観察しました。

Performance Analysis and Comparison of Machine and Deep Learning Algorithms for IoT Data Classification

IoTデータ分類のための機械および深層学習アルゴリズムのパフォーマンス分析と比較

著者:Meysam Vakili, Mohammad Ghamsari, Masoumeh Rezaei
URL:http://arxiv.org/abs/2001.09636v1

この論文の概要(機械翻訳による和訳)
近年、新興テクノロジーとしてのモノのインターネット(IoT)の成長は信じられないほどです。 IoTドメイン内のネットワーク対応デバイスの数は劇的に増加しており、電子データの大量生産につながっています。これらのデータには、科学、産業、ビジネス、社会生活など、さまざまな分野で使用できる貴重な情報が含まれています。この情報を抽出して分析し、IoTシステムをスマートにするために、唯一の選択肢は人工知能(AI)の世界に入り、機械学習と深層学習の技術を活用することです。このホワイトペーパーでは、6つのIoT関連データセットを使用して、分類タスク用の11の一般的なマシンおよび深層学習アルゴリズムのパフォーマンスを評価します。これらのアルゴリズムは、精度、再現率、f1スコア、精度、実行時間、ROC-AUCスコア、混同マトリックスなど、いくつかのパフォーマンス評価指標に従って比較されます。開発されたモデルの収束速度を評価するために、特定の実験も行われます。包括的な実験により、すべてのパフォーマンスメトリックを考慮すると、ランダムフォレストは他の機械学習モデルよりも優れたパフォーマンスを発揮し、深層学習モデルの中でも、ANNとCNNはより興味深い結果を達成したことが示されました。

A Novel Generative Neural Approach for InSAR Joint Phase Filtering and Coherence Estimation

InSARジョイント位相フィルタリングとコヒーレンス推定のための新しい生成ニューラルアプローチ

著者:Subhayan Mukherjee, Aaron Zimmer, Xinyao Sun, Parwant Ghuman, Irene Cheng
URL:http://arxiv.org/abs/2001.09631v1

この論文の概要(機械翻訳による和訳)
大気、地形、地面の不安定性などの地球の物理的特性は、その後の干渉合成開口レーダー(InSAR)画像で数十億の位相測定値(ピクセル)を区別することで決定できます。各ピクセルの品質(コヒーレンス)は、完全な情報(1)から完全なノイズ(0)まで変化する可能性があり、情報を含むピクセルのフィルタリングとともに定量化する必要があります。したがって、位相フィルタリングは、InSARのデジタル標高モデル(DEM)生産パイプラインにとって重要です。これは、空間的不整合(残留)を除去し、その後のアンラッピングを大幅に改善するためです。効果的かつ効率的な自動処理により手動の品質管理が不要になった場合、利用可能なInSARデータ量の最近の急増により、いくつかの地理的地域での広域監視(WAM)が促進されます。並列パターンコンピューティングアーキテクチャの進化と、視覚パターン認識で人間のパフォーマンスに匹敵するたたみ込みニューラルネットワーク(CNN)により、このアプローチはWAMのInSAR位相フィルタリングに理想的ですが、未だに未踏のままです。位相フィルタリングとコヒーレンス推定を結合するためのCNNベースの生成モデルである「GenInSAR」を提案します。衛星およびシミュレートされたInSAR画像を使用して、5つのアルゴリズムよりもGenInSARの全体的な優れたパフォーマンスを定性的に、および位相とコヒーレンスの2乗平均誤差、残差低減率、位相余弦誤差を使用して定量的に示します。

Variance Reduction with Sparse Gradients

スパース勾配による分散の削減

著者:Melih Elibol, Lihua Lei, Michael I. Jordan
URL:http://arxiv.org/abs/2001.09623v1

この論文の概要(機械翻訳による和訳)
SVRGやSpiderBoostなどの分散減少法では、大小のバッチ勾配の混合を使用して、確率論的勾配の分散を低減します。これらの方法の計算コストを削減するために、新しいスパース性演算子を導入しました:random-top-k演算子。 Ouroperatorは、top-k演算子とランダム化された座標降下演算子を組み合わせることにより、さまざまなアプリケーションで示される勾配の希薄性を推定することにより、計算の複雑さを軽減します。この演算子を使用すると、大規模なバッチ勾配は、分散の削減以上の利点を提供します。勾配のスパース性の信頼できる推定値です。理論的には、我々のアルゴリズムは少なくとも最良のアルゴリズム(SpiderBoost)と同等であり、random-top-k演算子が勾配スパース性をキャプチャするたびにパフォーマンスがさらに向上します。経験的に、私たちのアルゴリズムは、画像分類、自然言語処理、スパース行列因数分解などのさまざまなタスクでさまざまなモデルを使用して、SpiderBoostよりも一貫して優れています。また、単純な勾配エントロピー計算によってアルゴリズムの背後にある直感をサポートする経験的証拠を提供します。これは、反復ごとに勾配のスパース性を定量化するのに役立ちます。

Deep Graph Matching Consensus

ディープグラフマッチングコンセンサス

著者:Matthias Fey, Jan E. Lenssen, Christopher Morris, Jonathan Masci, Nils M. Kriege
URL:http://arxiv.org/abs/2001.09621v1

この論文の概要(機械翻訳による和訳)
この作業は、グラフ間の構造的対応を学習および改良するための2段階のニューラルアーキテクチャを示しています。最初に、グラフニューラルネットワークによって計算されたローカライズされたノード埋め込みを使用して、ノード間のソフトな対応の初期ランキングを取得します。次に、同期メッセージパッシングネットワークを使用して、ソフト通信を繰り返しランク付けし、グラフ間のローカル近傍で一致するコンセンサスに到達します。理論的および経験的に、メッセージパッシングスキームが、対応する近傍の十分に確立されたコンセンサスの尺度を計算し、それが反復再ランキングプロセスを導くために使用されることを示します。純粋にローカルでスパース性を認識したアーキテクチャは、大規模な現実世界の入力にうまく対応しながら、グローバルな通信を一貫して回復することができます。コンピュータービジョンの分野からの実世界のタスクと、知識グラフ間のエンティティの整合性に関する現在の最先端技術を改善するための手法の実用的な有効性を実証します。ソースコードは、https://github.com/rusty1s/deep-graph-matching-consensusで入手できます。

Data-Driven Prediction Model of Components Shift during Reflow Process in Surface Mount Technology

表面実装技術におけるリフロープロセス中のコンポーネントシフトのデータ駆動型予測モデル

著者:Irandokht Parviziomran, Shun Cao, Krishnaswami Srihari, Daehan Won
URL:http://arxiv.org/abs/2001.09619v1

この論文の概要(機械翻訳による和訳)
表面実装技術(SMT)では、はんだ付けされたパッドに取り付けられたコンポーネントは、リフロープロセス中に移動する可能性があります。この機能はセルフアライメントとして知られ、溶融はんだペーストの流体力学的挙動の結果です。この機能は、不正確なセルフアライメントがオーバーハング、トゥームストーンなどの欠陥を引き起こす一方、反対側では、希望する位置またはその近くでコンポーネントを完全に自己組み立てできるため、SMTでは重要です。この研究の目的は、回転だけでなくxおよびy方向のリフロー中のコンポーネントの動きを予測する機械学習モデルを開発することです。私たちの研究は、2つのステップで構成されています:(1)自己整合とコンポーネントジオメトリ、パッドジオメトリなどを含むさまざまな要因との関係を明らかにするために実験データが研究されています。サポートベクトル回帰(SVR)、ニューラルネットワーク(NN)、およびランダムフォレスト回帰(RFR)を使用したシフト。その結果、RFRは、99%、99%、および96%の平均適合度、およびx、yのコンポーネントシフトの平均予測誤差13.47(um)、12.02(um)、および1.52(deg。)でコンポーネントシフトを予測できます、およびそれぞれ回転方向。この機能強化により、ピックアンドプレースマシンでのパラメーターの最適化が将来的に可能になり、最適な配置場所を制御し、自己整合によって引き起こされる本質的な欠陥を最小限に抑えることができます。

Optimization of Passive Chip Components Placement with Self-Alignment Effect for Advanced Surface Mounting Technology

高度な表面実装技術のための自己整合効果による受動チップ部品配置の最適化

著者:Irandokht Parviziomran, Shun Cao, Haeyong Yang, Seungbae Park, Daehan Won
URL:http://arxiv.org/abs/2001.09612v1

この論文の概要(機械翻訳による和訳)
表面実装技術(SMT)は、電子部品をはんだ印刷回路基板(PCB)に直接配置し、リフローはんだ付けプロセスを目的としてPCBに恒久的に取り付ける電子パッケージングの強化された方法です。リフロープロセスでは、堆積したはんだペーストが溶融し始めると、電子部品は最高の対称性を実現する方向に移動します。この動作は、潜在的な取り付けミスアライメントを修正できるため、セルフアライメントとして知られています。この研究では、サポートベクター回帰(SVR)とランダムフォレスト回帰(RFR)を含む2つの顕著な機械学習アルゴリズムが、(1)コンポーネントの自己整合、堆積したはんだペーストの状態、および配置機械加工パラメーター間の相関を診断する予測手法として提案されています(2 )リフロープロセスに入る前に、PCBin x、y、および回転方向の最終コンポーネント位置を予測します。予測結果に基づいて、初期段階で配置パラメーターを最適化するための非線形最適化モデル(NLP)が開発されます。その結果、RFRは予測モデルの適合性とエラーの範囲を超えています。最適化モデルは、6つのサンプルに対して実行されます。理想的な位置(つまり、パッドの中心)からのリフロープロセス後のコンポーネント位置からの最小ユークリッド距離は、モデルで定義された境界に関して25.57({ mu} m)として示されます。

Practical Fast Gradient Sign Attack against Mammographic Image Classifier

マンモグラフィ画像分類器に対する実用的な高速勾配サイン攻撃

著者:Ibrahim Yilmaz
URL:http://arxiv.org/abs/2001.09610v1

この論文の概要(機械翻訳による和訳)
人工知能(AI)は長年にわたって主要な研究のトピックでした。特に、ディープニューラルネットワーク(DNN)の出現により、これらの研究は非常に成功しています。今日、機械は人間よりも高速で正確な意思決定を行うことができます。機械学習(ML)技術の大きな発展のおかげで、MLは教育、医学、マルウェア検出、自動運転車などの多くの異なる分野で使用されています。 。攻撃者はクリーンなデータを操作して、ML分類子をだまして目的の目標を達成できます。たとえば、良性のサンプルは悪意のあるサンプルとして変更することも、悪意のあるサンプルを良性として変更することもできますが、この変更は人間の観察者には認識されません。これは、多くの経済的損失、または重傷、さらには死に至る可能性があります。このペーパーの背後にある動機は、この問題を強調し、意識を高めたいということです。したがって、敵対的な攻撃に対するマンモグラフィ画像分類のセキュリティギャップが示されます。マンモグラフィ画像を使用してモデルをトレーニングし、精度の観点からモデルのパフォーマンスを評価します。後で、元のデータセットをポイズニングし、モデルによって分類ミスされた敵対的なサンプルを生成します。次に、構造的類似性インデックス(SSIM)を使用して、クリーンな画像と敵対的な画像間の類似性を分析します。最後に、さまざまな中毒因子を使用することで、悪用の成功度を示します。

Some Insights into Lifelong Reinforcement Learning Systems

生涯学習システムの洞察

著者:Changjian Li
URL:http://arxiv.org/abs/2001.09608v1

この論文の概要(機械翻訳による和訳)
生涯強化学習システムは、生涯にわたって環境とのトレイルアンドエラーの相互作用を通じて学習する能力を持つ学習システムです。この論文では、従来の強化学習パラダイムがこのタイプの学習システムのモデル化に失敗したことを示すためにいくつかの議論を行います。

Developing Multi-Task Recommendations with Long-Term Rewards via Policy Distilled Reinforcement Learning

ポリシー蒸留強化学習による長期報酬を伴うマルチタスク推奨の開発

著者:Xi Liu, Li Li, Ping-Chun Hsieh, Muhe Xie, Yong Ge, Rui Chen
URL:http://arxiv.org/abs/2001.09595v1

この論文の概要(機械翻訳による和訳)
オンライン製品とコンテンツの爆発的な成長に伴い、推奨技術は、情報過多を克服し、ユーザーエクスペリエンスを向上させ、ビジネス収益を高める効果的なツールと見なされています。近年、複数の関連する推奨タスクの長期的な報酬を同時に検討するという新しい要求事項を観察しました。長期的な報酬の検討は、ビジネスの収益と成長に強く結びついています。複数のタスクを同時に学習すると、一般に、マルチタスク学習での知識の共有により、個々のタスクのパフォーマンスが向上します。いくつかの既存の作品は、推薦における長期的な報酬を研究していますが、主に単一の推薦タスクに焦点を当てています。このペーパーでは、{ it PoDiRe}:推奨事項の長期的な報酬に対処し、同時に複数の推奨事項タスクを処理できる、 underline {po} lic underline {di} stilled underline {re}コマンドを提案します。この新しい推奨ソリューションは、深層強化学習と知識蒸留技術の融合に基づいており、異なるタスク間で知識共有を確立し、学習モデルのサイズを削減することができます。結果として得られるモデルは、リアルタイム推奨サービスのパフォーマンスの向上と応答待ち時間の短縮を実現することが期待されています。世界最大の商用モバイルゲームプラットフォームの1つであるSamsung Game Launcherと共同で、数億の大規模な実データに関する包括的な実験的研究を実施します。いくつかの標準評価指標の観点から、当社のソリューションが多くの最先端の方法よりも優れていることを示しています。

Naive Exploration is Optimal for Online LQR

素朴な探査はオンラインLQRに最適です

著者:Max Simchowitz, Dylan J. Foster
URL:http://arxiv.org/abs/2001.09576v1

この論文の概要(機械翻訳による和訳)
真のシステムパラメータが不明な線形二次レギュレータのオンライン適応制御の問題を検討します。最適な後悔が$ widetilde { Theta}({ sqrt {d _ { mathbf {u}} ^ 2 d _ { mathbf {x}} T}})$としてスケーリングすることを示す新しい上限と下限を証明します。 $ T $はタイムステップの数、$ d _ { mathbf {u}} $は入力空間の次元、$ d _ { mathbf {x}} $はシステム状態の次元です。特に、下限は$ mathrm {poly}( log {} T)$-regretアルゴリズムの可能性を排除していますが、これは問題の明らかな強い凸性のために推測されています。 emph {certaintyequivalence control}のバリアント。学習者は、探索的ランダムノイズを注入しながら、システムの推定値に最適なコントローラーに従って制御入力を選択します。このアプローチは、Maniaらによって$ sqrt {T} $-後悔を達成することが示されました。 2019年、学習者がシステムマトリックスの推定値を継続的に調整する場合、この方法は最適な次元依存性も達成することを示しています。上限と下限の中心にあるのは、リカッティ方程式の摂動を制御するための新しいアプローチです。これを emph {self-bounding ODEmethod}と呼びます。このアプローチは、 emph {anystabilizable instance}を保持する後悔の上限を可能にし、単一の安定化コントローラーを除いてシステムの事前知識を必要とせず、自然な制御理論量でスケーリングします。

Heterogeneous Learning from Demonstration

デモンストレーションからの異種学習

著者:Rohan Paleja, Matthew Gombolay
URL:http://arxiv.org/abs/2001.09569v1

この論文の概要(機械翻訳による和訳)
人間とロボットの両方の強みを活用できる人間ロボットシステムの開発は、業界および研究全体にわたって予測される広範囲の影響のために非常に求められています。私たちは、ロボットが高度な自律性を持って行動できなければ、これらのシステムの真の可能性に達することはできず、手動のタスクやテレオペレーションの負担を軽減できると考えています。このレベルの自律性を実現するには、ロボットは人間のパートナーとスムーズに連携し、明示的なコマンドなしでニーズを推測できる必要があります。この推論では、ロボットがパートナーの不均一性を検出および分類できる必要があります。ベイジアン推論に基づいて不均一なデモンストレーションから学習するためのフレームワークを提案し、StarCraft IIからのゲームプレイの実世界のデータセットに対する一連のアプローチを評価します。この評価は、当社のベイジアンアプローチが従来の方法を最大12.8 $%$上回る可能性があるという証拠を提供します。

Comprehensive Analysis of Time Series Forecasting Using Neural Networks

ニューラルネットワークを使用した時系列予測の包括的な分析

著者:Manie Tadayon, Yumi Iwashita
URL:http://arxiv.org/abs/2001.09547v1

この論文の概要(機械翻訳による和訳)
時系列予測は最近多くの注目を集めています。これは、多くの実世界の現象を時系列としてモデル化できるためです。大量のデータとコンピューターの処理能力の最近の進歩により、研究者はニューラルネットワークなどのより高度な機械学習アルゴリズムを開発して、時系列データを予測できます。この論文では、動的測定を使用して時系列データを予測するために、さまざまなニューラルネットワークアーキテクチャを提案します。さらに、予測のために静的測定と動的測定を組み合わせる方法に関するさまざまなアーキテクチャを紹介します。また、予測精度の異常検出やクラスタリングなどの手法を実行することの重要性についても調査します。我々の結果は、クラスタリングが全体的な予測時間を改善し、ニューラルネットワークの予測性能を改善できることを示しています。さらに、機能ベースのクラスタリングは、速度と効率の点で距離ベースのクラスタリングよりも優れていることを示しています。最後に、我々の結果は、ターゲット変数を予測するためにさらに予測変数を追加しても、予測精度が必ずしも向上しないことを示しています。

Learning the Hypotheses Space from data Part I: Learning Space and U-curve Property

データから仮説空間を学習パートI:学習空間とU曲線特性

著者:Diego Marcondes, Adilson Simonis, Junior Barrera
URL:http://arxiv.org/abs/2001.09532v1

この論文の概要(機械翻訳による和訳)
不可知論的PAC学習モデルは、仮説スペース$ mathcal {H} $、確率分布$ P $、サンプル複雑度関数$ m _ { mathcal {H}}( epsilon、 delta):[0、 1] ^ {2} mapsto mathbb {Z} _ {+} $ ofprecision $ epsilon $およびConfidence $ 1- delta $、有限iid sample $ mathcal {D} _ {N} $、コスト関数$ ell $および学習アルゴリズム$ mathbb {A}( mathcal {H}、 mathcal {D} _ {N})$ターゲット関数$ h ^ { star}を近似する$ hat {h} in mathcal {H} $を推定しますこのモデルでは、事前情報は$ mathcal {H} $および$ ell $で表されますが、問題解決は、$ mathcal {H} $の特定の代数構造および対応する学習アルゴリズムを使用して、いくつかの応用学習モデルでインスタンス化されます。ただし、これらの適用されたモデルは、古典的なPAC学習理論ではカバーされていない追加の重要な概念であるモデル選択と正則化を使用します。このペーパーでは、これらの概念をカバーするこのモデルの拡張機能について説明します。追加された主な原理は、利用可能なサンプルと互換性のあるVC次元を持つ$ mathcal {H} $の部分空間のデータのみに基づく選択です。この原理を形式化するために、学習空間$ mathbb {L}( mathcal {H})$の概念は、$ mathcal {H} $をカバーし、満たす$ mathcal {H} $のサブセットのポーズです関連する部分空間のVC次元に関するプロパティは、モデル選択アルゴリズムの自然探索空間として提示されます。この新しいフレームワークで得られた注目すべき結果は、推定されたサンプル外エラーサーフェスにつながる$ mathbb {L}( mathcal {H})$および$ ell $の条件です。これは、$ mathbbの真のUカーブです。 {L}( mathcal {H})$チェーン。$ mathbb {L}( mathcal {H})$でのより効率的な検索を可能にします。したがって、この新しいフレームワークでは、Uカーブ最適化問題はモデル選択アルゴリズムの自然なコンポーネントになります。

Imperfect ImaGANation: Implications of GANs Exacerbating Biases on Facial Data Augmentation and Snapchat Selfie Lenses

不完全なImaGANation:顔データの増強とSnapchat Selfieレンズに対するバイアスを悪化させるGANの意味

著者:Niharika Jain, Alberto Olmo, Sailik Sengupta, Lydia Manikonda, Subbarao Kambhampati
URL:http://arxiv.org/abs/2001.09528v1

この論文の概要(機械翻訳による和訳)
最近、GANによって生成された合成データの使用は、多くのアプリケーションのデータ増強を行う一般的な方法になりました。実践者は、これを、データを大量に消費する機械学習モデルの合成データを取得する経済的な方法として賞賛していますが、すでにバイアスがかけられているデータセットに適用した場合、そのような拡張手法の危険性を認識することは明らかではありません。 GANが元のデータの分布を複製することを期待しますが、データが制限され、ネットワーク容量が限られている現実の環境では、GANはモード崩壊の影響を受けます。特に、このデータがバランスの取れていないオンラインソーシャルメディアプラットフォームまたはWebからのものである場合。このペーパーでは、データがいくつかの軸(性別、人種など)に沿ってバイアスを示す設定で、Generative Adversarial Networks(GAN)の障害モードが生成されたデータのバイアスを悪化させることを示します。多くの場合、このバイアスは避けられません。米国の47のオンライン大学ディレクトリWebページから収集された工学部のヘッドショットのデータセットの入力が、白人(男性)に偏っていることを経験的に示しています。男性の顔の特徴と白い肌の色(人間の研究と最新の性別認識システムを使用して推定)。また、Snapchatの爆発的に人気のある「女性」フィルター(GANの条件付きバリアントを使用することで広く受け入れられている)が、顔画像をより女性的に見せようとするときに、色の女性の肌の色調を一貫して明るくする方法を強調する予備的なケーススタディも実施します。私たちの研究は、ウェブデータでGANベースの増強技術を使用することでトレーニングデータのバイアスを無意識に増加させ、顔のアプリケーションにバイアスデータセットを使用することの危険性を示す素人の実践者のための注意書きとして役立つことを意図しています。

Markov-Chain Monte Carlo Approximation of the Ideal Observer using Generative Adversarial Networks

生成的敵対ネットワークを用いた理想オブザーバーのマルコフ連鎖モンテカルロ近似

著者:Weimin Zhou, Mark A. Anastasio
URL:http://arxiv.org/abs/2001.09526v1

この論文の概要(機械翻訳による和訳)
信号検出タスク用に医療画像システムを最適化する場合、理想的なオブザーバー(IO)パフォーマンスが提唱されています。ただし、IOテスト統計の分析計算は一般に難解です。 IOテストの統計を概算するために、マルコフ連鎖モンテカルロ(MCMC)手法を採用したサンプリングベースの方法が開発されました。ただし、MCMC手法の現在のアプリケーションは、ゴツゴツしたオブジェクトモデルやバイナリテクスチャモデルなどのいくつかのオブジェクトモデルに限定されており、MCMCmethodsを他のより洗練されたオブジェクトモデルで実装する方法は不明のままです。生成的敵対ネットワーク(GAN)を使用する深層学習法は、画像データから確率的オブジェクトモデル(SOM)を学習するための大きな約束を保持します。この研究では、GANを使用して学習したSOMにMCMC技術を適用することでIOを概算する方法を説明しました。提案された方法は、GANを使用して学習できる任意のオブジェクトモデルで使用できるため、IOパフォーマンスを概算するためのMCMC手法の適用範囲が拡張されます。本研究では、既知の正確な信号(SKE)と既知の統計的な信号(SKS)の両方のバイナリ信号検出タスクが考慮されます。提案された方法の利点について説明します。

Progressively-Growing AmbientGANs For Learning Stochastic Object Models From Imaging Measurements

イメージング測定から確率的オブジェクトモデルを学習するための漸進的に成長するAmbientGAN

著者:Weimin Zhou, Sayantan Bhadra, Frank J. Brooks, Hua Li, Mark A. Anastasio
URL:http://arxiv.org/abs/2001.09523v1

この論文の概要(機械翻訳による和訳)
医用画像システムの客観的な最適化には、測定データのランダム性のすべてのソースの完全な特性評価が必要です。これには、画像化するオブジェクトのアンサンブル内のばらつきが含まれます。これは、イメージングするオブジェクトのクラスの変動性を記述する確率的オブジェクトモデル(SOM)を確立することで実現できます。生成的敵対ネットワーク(GAN)は、SOMを確立するのに役立つ可能性があります。これらは、トレーニングデータのアンサンブル内の変動性を記述する生成モデルを学習する大きな可能性を秘めているためです。ただし、医用画像システムでは、オブジェクトの特性のノイズの多い間接的な表現である画像測定値を記録するため、GANを直接適用して、画像化するオブジェクトの確率モデルを確立することはできません。この問題に対処するため、AmbientGANという名前の拡張GANアーキテクチャが開発され、ノイズの多い間接測定データからSOMを確立しました。ただし、敵対者の訓練は不安定になる可能性があるため、AmbientGANの適用可能性は潜在的に制限される可能性があります。この作業では、ノイズと間接的な画像測定からSOMを確立するためのAmbientGANのトレーニングを安定させるために、AmbientGANs(ProAGAN)の漸進的な成長戦略を提案します。理想的な磁気共鳴(MR)イメージングシステムと臨床MR脳画像が考慮されます。提案された方法論は、ProAGANで生成された合成画像と真のオブジェクトの特性を表す画像を使用して計算された信号検出性能を比較することにより評価されます。

Multi-task Learning for Voice Trigger Detection

音声トリガー検出のためのマルチタスク学習

著者:Siddharth Sigtia, Pascal Clark, Rob Haynes, Hywel Richards, John Bridle
URL:http://arxiv.org/abs/2001.09519v1

この論文の概要(機械翻訳による和訳)
スマートスピーカー用の音声トリガー検出システムの設計について説明します。この調査では、2つの大きな課題に対処します。 1つ目は、検出器が複雑な音響環境に配置され、外部ノイズとデバイス自体による大きな再生があることです。第二に、特定のキーワードまたはトリガーフレーズのトレーニングサンプルを収集することは困難であり、トリガーフレーズ固有のトレーニングデータが不足します。低電力検出器が常に実行され、トリガーフレーズをリッスンする2段階のカスケードアーキテクチャについて説明します。この段階で検出が行われた場合、候補のオーディオセグメントは、セグメントがトリガーフレーズを含むことを検証するために、より大きく複雑なモデルによって再スコアリングされます。この研究では、これらの2パス検出器のアーキテクチャと設計に注目します。ラベル付きの大きなトレーニングデータセットが与えられた場合、音声転写を生成する一般的な音響モデルをトレーニングすることから始めます。次に、ベースラインシステムにとって困難な、はるかに小さな例のデータセットを収集します。次に、マルチタスク学習を使用してモデルをトレーニングし、より大きなデータセットで正確な音声表記を同時に生成します。私たちの結果は、提案されたモデルが、追加のパラメーターを必要としないさまざまな困難なテスト条件でのベースラインと比較してエラーを半分に減らすことを示しています。

An interpretable semi-supervised classifier using two different strategies for amended self-labeling

修正された自己ラベル付けのための2つの異なる戦略を使用した解釈可能な半教師付き分類器

著者:Isel Grau, Dipankar Sengupta, Maria M. Garcia Lorenzo, Ann Nowe
URL:http://arxiv.org/abs/2001.09502v1

この論文の概要(機械翻訳による和訳)
一部の機械学習アプリケーションのコンテキストでは、データインスタンスの取得は比較的簡単なプロセスですが、それらのラベル付けは非常に高価または退屈になる可能性があります。このようなシナリオでは、ラベル付けされたインスタンスがほとんどないデータセットと、ラベル付けされていないインスタンスが多くなります。半教師付き分類手法は、分類段階の一般化能力を高めるために、学習段階でラベル付きデータとラベルなしデータを組み合わせます。残念ながら、ほとんどの成功した半教師付き分類器は、結果を説明することを許可していないため、ブラックボックスのように動作します。しかし、専門家が意思決定プロセスの明確な理解を要求する問題領域の数が増えています。本論文では、ブラックボックスを使用して欠落しているクラスラベルを推定し、ホワイトボックスを使用して最終予測を行う、解釈可能な自己ラベル付けグレーボックス分類器を提示する拡張実験研究について報告します。自己ラベル付けプロセスを修正するための2つの異なるアプローチを検討します。ブラックボックスの信頼性に基づく最初のアプローチと、ラフセット理論からの測定に基づく後者のアプローチです。拡張実験研究の結果は、分類器の透明性と単純さによって解釈可能性をサポートし、文献で報告されている最新の自己ラベル分類器と比較して優れた予測率を達成しています。

Temporal Information Processing on Noisy Quantum Computers

ノイズの多い量子コンピューターでの時間情報処理

著者:Jiayin Chen, Hendra I. Nurdin, Naoki Yamamoto
URL:http://arxiv.org/abs/2001.09498v1

この論文の概要(機械翻訳による和訳)
機械学習と量子コンピューティングの組み合わせは、以前は受け入れられなかった問題に対処するための有望なアプローチとして浮上しています。 Reservoircomputingは、時間情報処理のために非線形動的システムを利用する最先端の機械学習パラダイムであり、その状態空間次元がパフォーマンスに重要な役割を果たします。ここでは、複雑な散逸的量子力学と指数関数的に大きな量子状態空間を活用する量子リザーバーシステムを提案します。私たちの提案は、利用可能なノイズの多いゲートモデル量子プロセッサで容易に実装でき、ニューラルモデリング、音声認識、自然言語処理などのアプリケーションで重要な非線形短期メモリマップを近似するための汎用的な計算能力を備えています。超伝導量子コンピューター上で、小さくてノイズの多い量子リザーバーが高次の非線形時間タスクに取り組むことができることを実験的に示します。私たちの理論的および実験的結果は、忠実度が向上するが、量子誤差補正のない短期ゲートモデル量子コンピューターの魅力的な時間処理アプリケーションへの道を開き、学際的な分野での静的分類および回帰タスクを超えた幅広いアプリケーションに対するこれらのデバイスの可能性を示しています。

Ensemble Noise Simulation to Handle Uncertainty about Gradient-based Adversarial Attacks

勾配ベースの敵対攻撃に関する不確実性を処理するアンサンブルノイズシミュレーション

著者:Rehana Mahfuz, Rajeev Sahay, Aly El Gamal
URL:http://arxiv.org/abs/2001.09486v1

この論文の概要(機械翻訳による和訳)
ニューラルネットワークに対する勾配ベースの敵対攻撃は、攻撃アルゴリズムが勾配に依存する方法、攻撃の作成に使用されるネットワークアーキテクチャ、またはその両方を変えることにより、さまざまな方法で作成できます。最近の研究では、攻撃者の動作に不確実性がある場合(つまり、攻撃者が特定のネットワークアーキテクチャを使用して特定の攻撃を生成することが期待される場合)の分類子の防御に焦点を当てています。しかし、攻撃者が特定の方法で動作することが保証されていない場合、文献には戦略的防御を考案する方法がありません。さまざまな分類子の勾配に基づいたさまざまな攻撃アルゴリズムを使用して、攻撃者のノイズの多い摂動をシミュレートすることにより、このギャップを埋めます。シミュレートされたノイズでトレーニングされた前処理Denoising Autoencoder(DAE)防御を使用して分析を実行します。提案されたアンサンブルトレーニングされた防御を使用して、不確実性を処理する努力がなされていない状況と比較して、攻撃後の精度が大幅に向上することを実証します。

Multimodal Data Fusion based on the Global Workspace Theory

グローバルワークスペース理論に基づくマルチモーダルデータ融合

著者:Cong Bao, Zafeirios Fountas, Temitayo Olugbade, Nadia Bianchi-Berthouze
URL:http://arxiv.org/abs/2001.09485v1

この論文の概要(機械翻訳による和訳)
マルチモーダルデータ融合における動的な不確実性の課題に対処する、Global WorkspaceNetwork(GWN)という名前の新しいニューラルネットワークアーキテクチャを提案します。 GWNは、認知科学から確立されたGlobalWorkspace Theoryに触発されています。私たちは、時間とともに進化する複数のモダリティ間の注意のモデルとしてそれを実装します。 GWNは、患者と健康な参加者との間の差別について、2つのクラスで平均して0.92のF1スコアを達成しました。このタスクでは、GWNはバニラアーキテクチャを大幅に上回りました。さらに、EmoPainデータセットに基づいて、患者の3つの痛みレベル(平均F1スコア= 0.75)をさらに分類することで、バニラモデルよりも優れていました。さらに、GWNの動作と、マルチモーダルデータの不確実性に対処する機能の広範な分析を提供します。

Tractable Reinforcement Learning of Signal Temporal Logic Objectives

信号時相論理目標の実行可能な強化学習

著者:Harish Venkataraman, Derya Aksaray, Peter Seiler
URL:http://arxiv.org/abs/2001.09467v1

この論文の概要(機械翻訳による和訳)
シグナル時相論理(STL)は、時間制限のある現実世界のロボットタスクと安全仕様を指定するための表現力豊かな言語です。最近、強化学習(RL)を介してSTL仕様を満たす最適なポリシーを学習することに関心があります。 STL仕様を満たすことを学習するには、多くの場合、報酬と次のアクションを計算するのに十分な長さの状態履歴が必要です。歴史の必要性は、学習問題の指数関数的な状態空間の成長をもたらします。したがって、学習の問題は、ほとんどの実際のアプリケーションでは計算上手に負えなくなります。この論文では、新しい拡張状態空間表現で状態履歴をキャプチャするコンパクトな手段を提案します。目的に対する近似(満足度の最大化)が提案され、新しい拡張状態空間で解決されます。近似解の性能限界を示し、シミュレーションにより既存の技術の解と比較します。

Explainable Artificial Intelligence and Machine Learning: A reality rooted perspective

説明可能な人工知能と機械学習:現実に根ざした視点

著者:Frank Emmert-Streib, Olli Yli-Harja, Matthias Dehmer
URL:http://arxiv.org/abs/2001.09464v1

この論文の概要(機械翻訳による和訳)
私たちは、技術の進歩の結果として、ほぼすべての科学分野で生成されたビッグデータの可用性に慣れています。ただし、このようなデータの分析には大きな課題があります。これらの1つは、人工知能(AI)または機械学習方法の説明可能性に関連しています。現在、そのような方法の多くは、その動作メカニズムに関して非透過的であり、このため、ブラックボックスモデルと呼ばれ、最も顕著なのは深層学習方法です。しかし、これは健康科学や刑事司法を含む多くの分野で深刻な問題を構成することが理解されており、説明可能なAIを支持する議論が提唱されています。このペーパーでは、説明可能なAIを提示する通常の視点を想定していませんが、説明可能なAIの可能性について説明します。違いは、希望的観測ではなく、物理学を超えた科学理論に関連した現実に基づいた特性を提示することです。

LiteMORT: A memory efficient gradient boosting tree system on adaptive compact distributions

LiteMORT:適応コンパクト分布でのメモリ効率の良い勾配ブースティングツリーシステム

著者:Yingshi Chen
URL:http://arxiv.org/abs/2001.09419v1

この論文の概要(機械翻訳による和訳)
Gradient Boosted Decision Trees(GBDT)は、多くの商用および学術データアプリケーション向けの主要なアルゴリズムです。このアルゴリズム、特にヒストグラムテクニックの詳細な分析を示します。 3つの新しい変更を提示します。 1)メモリ使用量を削減するためにメモリ技術を共有します。多くの場合、データソース自体のみが必要で、追加のメモリは必要ありません。 2)「マージオーバーフローの問題」の暗黙的なマージ。「マージオーバーフロー」とは、いくつかの小さなデータセットを巨大なデータセットにマージすることを意味します。暗黙的にマージすることにより、GBDTモデルをトレーニングするために元の小さなデータセットのみが必要になります。 3)ヒストグラムビンの適応サイズ変更アルゴリズムにより、精度が向上します。 2つの大規模なKaggleコンテストでの実験により、私たちの方法が検証されました。彼らはLightGBMよりもはるかに少ないメモリを使用し、より高い精度を持っています。これらのアルゴリズムは、オープンソースパッケージLiteMORTに実装されています。ソースコードはhttps://github.com/closest-git/LiteMORTで入手できます

Inference in Multi-Layer Networks with Matrix-Valued Unknowns

行列値不明の多層ネットワークでの推論

著者:Parthe Pandit, Mojtaba Sahraee-Ardakan, Sundeep Rangan, Philip Schniter, Alyson K. Fletcher
URL:http://arxiv.org/abs/2001.09396v1

この論文の概要(機械翻訳による和訳)
出力の観察から、確率的多層ニューラルネットワークの入力変数と隠れ変数を推測する問題を検討します。各レイヤーの隠し変数は行列として表されます。この問題は、深い生成的事前モデル、マルチタスクおよび混合回帰、および特定のクラスの2層ニューラルネットワークを介した信号回復に適用されます。 MAPとMMSEの両方の推論に対する統一近似アルゴリズムは、最近開発された多層ベクトル近似メッセージパッシング(ML-VAMP)アルゴリズムを拡張して、行列値の未知数を処理することによって提案されます。提案された多層マトリックスVAMP(ML-Mat-VAMP)アルゴリズムのパフォーマンスは、特定のランダムな大規模システムの制限で正確に予測できることが示されています。右矢印 infty $、$ d $修正済み。 2層ニューラルネットワークの学習問題では、このスケーリングは、入力フィーチャとトレーニングサンプルの数が無限に増加する場合に対応しますが、非表示ノードの数は固定されたままです。分析により、パラメータの正確な予測と学習のテストエラーが可能になります。

A Lagrangian Dual Framework for Deep Neural Networks with Constraints

制約付きのディープニューラルネットワーク用のラグランジアンデュアルフレームワーク

著者:Ferdinando Fioretto, Terrence WK Mak, Federico Baldo, Michele Lombardi, Pascal Van Hentenryck
URL:http://arxiv.org/abs/2001.09394v1

この論文の概要(機械翻訳による和訳)
いくつかのエンジニアリング分野でのさまざまな計算上困難な制約付き最適化問題は、異なるシナリオの下で繰り返し解決されます。多くの場合、リアルタイム操作または大規模シミュレーション研究をサポートするために、高速かつ正確な近似の恩恵を受けます。このホワイトペーパーは、これらのアプリケーションのインスタンスを長期にわたって繰り返し解決することにより、蓄積される実質的なデータを活用する方法を探ることを目的としています。ラグランジュの双対性を活用してハードな制約の満足を促すディープラーニングモデルを導入します。提案された方法は、さまざまなデータセットおよび非精密計算アプリケーションに非差別的な決定を強制することにより、現実的なエネルギーネットワークのコレクションで評価されます。結果は、予測者による制約違反を劇的に減少させ、一部のアプリケーションでは予測精度を向上させる提案方法の有効性を示しています。

Regime Switching Bandits

レジームスイッチングバンディット

著者:Xiang Zhou, Ningyuan Chen, Xuefeng Gao, Yi Xiong
URL:http://arxiv.org/abs/2001.09390v1

この論文の概要(機械翻訳による和訳)
報酬がレジーム切り替えを示す多腕バンディット問題を研究します。具体的には、すべての武器から生成されるランダム報酬の分布は、有限状態マルコフ連鎖としてモデル化された共通の基礎状態に依存します。エージェントは基礎となる状態を観察せず、未知の遷移確率行列と報酬分布を学習する必要があります。この問題に対する効率的な学習アルゴリズムを提案し、隠れマルコフモデルのスペクトルモーメント法推定と強化学習の上位信頼限界法に基づいています。また、提案された学習アルゴリズムの後悔にバインドされた$ O(T ^ {2/3} sqrt { log T})$を確立します。ここで、$ T $は未知の地平線です。最後に、学習アルゴリズムの有効性を示すために数値実験を実施します。

Boosted and Differentially Private Ensembles of Decision Trees

決定木のブーストされた差分的プライベートアンサンブル

著者:Richard Nock, Wilko Henecka
URL:http://arxiv.org/abs/2001.09384v1

この論文の概要(機械翻訳による和訳)
決定木(DT)分類子のブーストアンサンブルは国際競争で非常に人気がありますが、私たちの知る限り、ランダムフォレストが現在DPで支配しているという点まで、 textit {also}差分プライベート(DP)にする方法については正式に知られていませんステージ。私たちの論文は、DTのプライバシーとブースティングピクチャが注目に値する一般的な技術的トレードオフを伴うという証拠から始まります。 DT誘導アルゴリズムは基本的に反復的であり、我々の発見は、ノードを分割するためのユーティリティとノイズのバランスをとるために損失を選択または調整する非自明な選択を意味します。これに対処するために、M $ alpha $ -lossと呼ばれるパラメーター化された新しい適切な損失を作成します。これにより、示されているように、感度とブースト保証の完全なスペクトルのトレードオフを微調整できます。次に、DT誘導中のトレードオフを適応的に調整して、費やされるプライバシー予算を制限する方法として textit {objectivecalibration}を導入し、正式に高い確率で限定的な深さのノードでブースト準拠のコンバージェンスを維持することができます。客観的なキャリブレーションは、DPなしの設定でも非常に競争力があります。私たちのアプローチは、特に高DPレジーム($ varepsilon leq 0.1 $)や、10個のタイムレスツリーを含むブーストされたアンサンブルでも、ランダムフォレストを非常に大きく打ち消す傾向があります。 。

GraphAF: a Flow-based Autoregressive Model for Molecular Graph Generation

GraphAF:分子グラフ生成のためのフローベースの自己回帰モデル

著者:Chence Shi, Minkai Xu, Zhaocheng Zhu, Weinan Zhang, Ming Zhang, Jian Tang
URL:http://arxiv.org/abs/2001.09382v1

この論文の概要(機械翻訳による和訳)
分子グラフの生成は、創薬の基本的な問題であり、注目を集めています。この問題は、化学的に有効な分子構造を生成するだけでなく、その間に化学的特性を最適化する必要があるため、挑戦的です。深層生成モデルの最近の進歩に着想を得て、本書では、GraphAFと呼ばれるグラフ生成のためのフローベースの自己回帰モデルを提案します。 GraphAFは、自己回帰アプローチとフローベースアプローチの両方の利点を組み合わせて、次のことを楽しんでいます。(1)データ密度推定のための高いモデルの柔軟性。 (2)トレーニングのための効率的な並列計算。 (3)原子価チェックのために化学領域の知識を活用できる反復サンプリングプロセス。実験結果は、GraphAFが化学知識ルールなしで68%の化学的に有効な分子と化学ルールで100%の有効な分子を生成できることを示しています。GraphAFのトレーニングプロセスは、既存の最先端のアプローチGCPNよりも2倍高速です。 GraphAFは、強化学習を使用して目標指向型プロパティ最適化のモデルを微調整した後、化学的特性の最適化と制約付きプロパティの最適化の両方で最先端のパフォーマンスを実現します。

Constrained Upper Confidence Reinforcement Learning

制約付き上位信頼度強化学習

著者:Liyuan Zheng, Lillian J. Ratliff
URL:http://arxiv.org/abs/2001.09377v1

この論文の概要(機械翻訳による和訳)
制約付きマルコフ決定プロセスは、意思決定者が補助コスト制約を満たすポリシーを選択する必要がある確率的決定問題のクラスです。この論文では、コスト関数によって記述される報酬関数と制約がアプリオリに未知であるが、遷移カーネルは既知である設定について、上部信頼強化学習を拡張します。このような設定は、未知の、潜在的に安全でない環境の調査を含む多くのアプリケーションによって十分に動機付けられています。アルゴリズムC-UCRLを提示し、準線形後悔($ O(T ^ { frac {3} {4}} sqrt { log(T / delta)})$を達成することを示します。確率$ 1- delta $で学習していても、制約を満たしながら報酬を与えます。例示的な例を提供します。

分野/キーワード:

論文ナビに登録すると・・・
①最新情報をメールでお届け!
  • 話題のニュース一覧
  • 注目のプレスリリース
  • 論文解説・最近のイベント
②論文解説記事の投稿
  • ご自身の論文の解説
  • 読んだ論文のメモ
  • 研究に関する情報のシェア
③セミナー情報の宣伝
  • ご自身が主催するイベント情報を投稿してシェア
  • ユーザーで作るセミナー日程まとめに参加
【併せて読みたい関連記事】
X
- Enter Your Location -
- or -
パスワード再発行
お気に入り
  • Total (0)
0