rnavi

2020-01-31

機械学習分野論文まとめ【2020年01月31日arXiv公開】

アブストまとめ

機械学習

View数：6,152

Like+1

お気に入り

2020年01月31日に発表された機械学習分野の論文63本のAbstractをまとめて和訳しました。

この記事の見出し

1 Towards a Kernel based Physical Interpretation of Model Uncertainty
2 A tutorial on ensembles and deep learning fusion with MNIST as guiding thread: A complex heterogeneous fusion scheme reaching 10 digits error
3 Transport Gaussian Processes for Regression
4 Fase-AL — Adaptation of Fast Adaptive Stacking of Ensembles for Supporting Active Learning
5 A Rigorous Framework for the Mean Field Limit of Multilayer Neural Networks
6 NCVis: Noise Contrastive Approach for Scalable Visualization
7 Analysing Affective Behavior in the First ABAW 2020 Competition
8 Uncovering life-course patterns with causal discovery and survival analysis
9 Non-Determinism in TensorFlow ResNets
10 Black-Box Saliency Map Generation Using Bayesian Optimisation
11 Adversarial Training for Aspect-Based Sentiment Analysis with BERT
12 Which way? Direction-Aware Attributed Graph Embedding
13 Improving the Robustness of Graphs through Reinforcement Learning and Graph Neural Networks
14 An Implicit Attention Mechanism for Deep Learning Pedestrian Re-identification Frameworks
15 HAMLET — A Learning Curve-Enabled Multi-Armed Bandit for Algorithm Selection
16 Real-time Linear Operator Construction and State Estimation with Kalman Filter
17 Deep combinatorial optimisation for optimal stopping time problems and stochastic impulse control. Application to swing options pricing and fixed transaction costs options hedging
18 Better Multi-class Probability Estimates for Small Data Sets
19 Learning Discrete Distributions by Dequantization
20 Survey of Deep Reinforcement Learning for Motion Planning of Autonomous Vehicles
21 How Does BN Increase Collapsed Neural Network Filters?
22 TCMI: a non-parametric mutual-dependence estimator for multivariate continuous distributions
23 Finite-time Analysis of Kullback-Leibler Upper Confidence Bounds for Optimal Adaptive Allocation with Multiple Plays and Markovian Rewards
24 A Hybrid Two-layer Feature Selection Method Using GeneticAlgorithm and Elastic Net
25 Kernel Selection for Modal Linear Regression: Optimal Kernel and IRLS Algorithm
26 AVATAR — Machine Learning Pipeline Evaluation Using Surrogate Model
27 Multi-Participant Multi-Class Vertical Federated Learning
28 A Graph-Based Approach for Active Learning in Regression
29 Adversarial Attacks on Convolutional Neural Networks in Facial Recognition Domain
30 Blocked Clusterwise Regression
31 Multi-Marginal Optimal Transport Defines a Generalized Metric
32 GradientDICE: Rethinking Generalized Offline Estimation of Stationary Values
33 Simulation of electron-proton scattering events by a Feature-Augmented and Transformed Generative Adversarial Network (FAT-GAN)
34 Ensemble Grammar Induction For Detecting Anomalies in Time Series
35 Urban2Vec: Incorporating Street View Imagery and POIs for Multi-Modal Urban Neighborhood Embedding
36 stream-learn — open-source Python library for difficult data stream batch analysis
37 Safe Predictors for Enforcing Input-Output Specifications
38 Bayesian Reasoning with Deep-Learned Knowledge
39 Improving Language Identification for Multilingual Speakers
40 Functional Sequential Treatment Allocation with Covariates
41 The Case for Bayesian Deep Learning
42 An Upper Bound of the Bias of Nadaraya-Watson Kernel Regression under Lipschitz Assumptions
43 REST: Robust and Efficient Neural Networks for Sleep Monitoring in the Wild
44 Maximum likelihood estimation and uncertainty quantification for Gaussian process approximation of deterministic functions
45 Examining the Benefits of Capsule Neural Networks
46 Reducing complexity and unidentifiability when modelling human atrial cells
47 On Constraint Definability in Tractable Probabilistic Models
48 Unsupervised Anomaly Detection for X-Ray Images
49 A scale-dependent notion of effective dimension
50 Variational Autoencoders for Opponent Modeling in Multi-Agent Systems
51 Convergence Guarantees for Gaussian Process Approximations Under Several Observation Models
52 Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning
53 Extreme Algorithm Selection With Dyadic Feature Representation
54 FOCUS: Dealing with Label Quality Disparity in Federated Learning
55 Constructing Deep Neural Networks with a Priori Knowledge of Wireless Tasks
56 Bayesian Neural Architecture Search using A Training-Free Performance Metric
57 The Tensor Brain: Semantic Decoding for Perception and Memory
58 Machine Learning in Thermodynamics: Prediction of Activity Coefficients by Matrix Completion
59 The Indian Chefs Process
60 Regularization Helps with Mitigating Poisoning Attacks: Distributionally-Robust Machine Learning Using the Wasserstein Distance
61 Treatment effect estimation with disentangled latent factors
62 Modelling and Quantifying Membership Information Leakage in Machine Learning
63 Binary Classification from Positive Data with Skewed Confidence

Towards a Kernel based Physical Interpretation of Model Uncertainty

モデル不確実性のカーネルベースの物理的解釈に向けて

著者：Rishabh Singh, Jose C. Principe
URL：http://arxiv.org/abs/2001.11495v1

この論文の概要（機械翻訳による和訳）
この論文では、その計量空間の量子物理的記述を課すことにより、データの不確実性の敏感なマルチモーダル定量化を提供する新しい情報理論的枠組みを紹介します。具体的には、カーネル平均埋め込みメトリックを使用して、RKHSで統計的にリッチデータに誘導される信号のPDF表現をレンダリングすることとは別に、潜在的な場としての信号の直感的な物理的解釈をもたらし、その結果、新しいエネルギーベースの定式化を実現します。これにより、量子物理学のモーメント分解概念を利用することにより、データのマルチスケール不確実性の特徴を情報固有モードの形で抽出することができます。本質的に、信号のPDFの局所的実現を量子不確実性モーメントの観点から分解します。そのカーネルベースとマルチモーダルの性質により、このようなフレームワークは、モデルの不確実性を定量化するための強力な代理ツールとして役立つと仮定します。したがって、このフレームワークの用途を、従来のベイジアンおよびアンサンブルベースのUQ手法のさまざまな制限を克服する、ポイント予測ニューラルネットワークモデルの予測不確実性の定量化のためのノンパラメトリックで非侵入的な代理ツールとして具体的に提示します。いくつかの確立された不確実性定量化方法との実験的比較は、フレームワークによって示されるパフォーマンスの利点を示しています。

A tutorial on ensembles and deep learning fusion with MNIST as guiding thread: A complex heterogeneous fusion scheme reaching 10 digits error

アンサンブルとガイドスレッドとしてのMNISTを使用したディープラーニングフュージョンに関するチュートリアル：10桁のエラーに達する複雑な異種フュージョンスキーム

著者：S. Tabik, R. F. Alvear-Sandoval, M. M. Ruiz, J. L. Sancho-Gómez, A. R. Figueiras-Vidal, F. Herrera
URL：http://arxiv.org/abs/2001.11486v1

この論文の概要（機械翻訳による和訳）
アンサンブル法は、ベストシングル分類モデルの結果を改善するために広く使用されています。実際、多くの作品は、主に特定のアンサンブル手法を適用することにより、より良い結果を達成しています。ただし、ヘテロジニアスアンサンブル戦略を使用して複雑なフュージョンスキームを分析するワークスはほとんどありません。異種アンサンブルに基づいて、多様性から利益を得るモードと見なすことができます。 10個の誤分類画像のみでMNISTの新しい記録を達成する複雑な融合設計を導入します。

Transport Gaussian Processes for Regression

回帰のための輸送ガウス過程

著者：Gonzalo Rios
URL：http://arxiv.org/abs/2001.11473v1

この論文の概要（機械翻訳による和訳）
ガウス過程（GP）事前分布は、ベイジアン推論の魅力的なモデリングプロパティを備えたノンパラメトリックな生成モデルです。ノイズの多い観測を通じて非線形の関係をモデル化でき、トレーニングと推論の閉形式表現を持ち、解釈可能なハイパーパラメーターによって管理されます。ただし、GPモデルは、ガウス性に依存しています。これは、いくつかの現実世界のシナリオでは成り立たない仮定です。たとえば、観測値が制限されている場合や極端な値の依存関係がある場合、物理学、金融、社会科学の自然現象です。ガウスを超えた確率過程がGPコミュニティの注目を集めましたが、原則的な定義と厳密な処理はまだ欠けています。これに関して、確率論的プロセスを構築する方法論を提案します。確率論的プロセスには、GP、ワープGP、Student-tprocesses、および単一の統合アプローチの下でのその他のいくつかが含まれます。また、回帰問題で提案されたモデルのトレーニングと推論のための式とアルゴリズムも提供します。私たちのアプローチは、レイヤーベースのモデルに触発され、提案された各レイヤーは、生成された確率過程にわたって特定のプロパティを変更します。これにより、GPの魅力的な特性を維持しながら、境界およびコピュラがガウスである必要のない他のより表現力のある確率過程に先立って、標準のガウスホワイトノイズをプッシュフォワードできます。実世界のデータを使用した実験により、提案されたモデルを検証します。

Fase-AL — Adaptation of Fast Adaptive Stacking of Ensembles for Supporting Active Learning

Fase-AL-アクティブな学習をサポートするためのアンサンブルの高速適応スタッキングの適応

著者：Agustín Alejandro Ortiz-Díaz, Fabiano Baldo, Laura María Palomino Mariño, Alberto Verdecia Cabrera
URL：http://arxiv.org/abs/2001.11466v1

この論文の概要（機械翻訳による和訳）
データストリームをマイニングするための分類アルゴリズムは、近年広く研究されています。ただし、これらのアルゴリズムの多くは、ラベル付きインスタンスを必要とする教師あり学習用に設計されています。それにもかかわらず、データのラベル付けには費用がかかり、時間がかかります。このため、モデルのパフォーマンスを大幅に損なうことなくラベリングプロセスのコストを削減するために、代替の学習パラダイムが提案されています。能動学習はこれらのパラダイムの1つであり、その主な目的は、適切なレベルの精度を達成するラベル付きの例の可能な限り少ない数を要求する分類モデルを構築することです。したがって、この作業では、アクティブラーニングを使用して、ラベルなしインスタンスで分類モデルを誘導するFASE-ALアルゴリズムを紹介します。 FASE-ALは、アンサンブルの高速適応スタッキング（FASE）アルゴリズムに基づいています。 FASEは、入力データストリームに概念ドリフトがある場合にモデルを検出および適応するアンサンブルアルゴリズムです。 FASE-ALは、文献にある4つの異なる能動学習戦略と比較されました。実験では、実際のデータベースと合成データベースを使用しました。このアルゴリズムは、正しく分類されたインスタンスの割合に関して有望な結果を達成します。

A Rigorous Framework for the Mean Field Limit of Multilayer Neural Networks

多層ニューラルネットワークの平均場限界のための厳密なフレームワーク

著者：Phan-Minh Nguyen, Huy Tuan Pham
URL：http://arxiv.org/abs/2001.11443v1

この論文の概要（機械翻訳による和訳）
平均場レジームでの多層ニューラルネットワークの数学的に厳密なフレームワークを開発します。ネットワークの幅が大きくなると、ネットワークの学習軌道は、ODEのシステムによって特徴付けられる、意味のある動的に非線形の制限（ textit {平均フィールド}制限）によってうまく捕捉されることが示されます。私たちのフレームワークは、広範なネットワークアーキテクチャ、学習ダイナミクス、およびネットワーク初期化に適用されます。フレームワークの中心にあるのは、 textit {neuronal embedding}の新しいアイデアです。フレームワークの2つのアプリケーションを示します。最初に、フレームワークは、独立した同一に分散された初期化が平均フィールド制限に与える単純化効果を研究するための原則的な方法を提供します。第二に、2層および3層ネットワークのグローバル収束保証を証明します。凸性に依存する以前の研究とは異なり、我々の結果には、無限幅ニューラルネットワークの特徴である特定の普遍的な近似特性が必要です。私たちの知る限りでは、これは、平均場レジームの2層以上のニューラルネットワークに対して初めてグローバルな収束が確立されたものです。

NCVis: Noise Contrastive Approach for Scalable Visualization

NCVis：スケーラブルな視覚化のためのノイズ対照的アプローチ

著者：Aleksandr Artemenkov, Maxim Panov
URL：http://arxiv.org/abs/2001.11411v1

この論文の概要（機械翻訳による和訳）
ast-SNEなどの次元削減によるデータ視覚化の最新の方法には、通常、大量の高次元データへの適用を妨げるパフォーマンスの問題があります。この作業では、NCVisを提案します。これは、ノイズのコントラスト推定の健全な統計的根拠に基づいて構築された高性能な次元削減手法です。 NCVisは、他の方法の表現品質を維持しながら、速度の点で最先端の技術よりも優れていることを示しています。特に、提案されたアプローチは、数分で100万を超えるニュースヘッドラインの大規模なデータセットを正常に処理し、人間が読める方法で基本的な構造を提示します。さらに、手書き数字。このようなソフトウェアをより広く使用することで、大規模なデータ分析を大幅に簡素化し、この分野への参入障壁を下げることができると考えています。

Analysing Affective Behavior in the First ABAW 2020 Competition

最初のABAW 2020大会での情動行動の分析

著者：Dimitrios Kollias, Attila Schulc, Elnar Hajiyev, Stefanos Zafeiriou
URL：http://arxiv.org/abs/2001.11409v1

この論文の概要（機械翻訳による和訳）
情動行動分析インザワイルド（ABAW）2020コンペティションは、価数覚醒推定、基本的な表現認識、アクションユニット検出の3つの主要な行動タスクの自動分析を目指した最初のコンペティションです。それは3つのチャレンジに分割され、それぞれがそれぞれの行動タスクに対処します。課題については、共通のベンチマークデータベースであるAff-Wild2を提供します。これは、大規模な野生のデータベースであり、これら3つのタスクすべてに注釈が付けられた最初のデータベースです。この論文では、2020年5月にアルゼンチンのブエノスアイレスで開催されたIEEE Conference on Face andGesture Recognitionと併せて開催されるこのコンペティションについて説明します。コンペコーパスを活用した3つのチャレンジを紹介します。評価指標の概要を説明し、ベースラインの方法論とそれらが各チャレンジに適用されたときに得られた結果を提示します。コンペティションに関する詳細情報および利用されているデータベースへのアクセス方法の詳細は、コンペティションサイト：http：//ibug.doc.ic.ac.uk/resources/fg-2020-competition-affective-behavior-analysisで提供されています。

Uncovering life-course patterns with causal discovery and survival analysis

因果的発見と生存分析によるライフコースパターンの発見

著者：Bojan Kostic, Romain Crastes dit Sourd, Stephane Hess, Joachim Scheiner, Christian Holz-Rau, Francisco C. Pereira
URL：http://arxiv.org/abs/2001.11399v1

この論文の概要（機械翻訳による和訳）
私たちは、因果関係の発見と生存分析を通じて確率論的な観点から人生のイベント選択と発生をモデリングするための新しいアプローチと探索的研究を提供します。私たちのアプローチは、2つのレベルの問題として定式化されています。上位レベルでは、因果発見ツールを使用して、ライフイベントグラフを作成します。下位レベルでは、ライフイベントのペアに対して、生存時間分析によるイベントごとのモデリングがモデル時間依存の遷移確率に適用されます。結婚、新しい車の購入、出産、家の移転、離婚などのいくつかのライフイベントが、サバイバルモデリングの社会人口統計的属性とともに分析されました。その一部は、年齢、国籍、子供の数、自宅の所有権。このデータは、ドイツのドルトムントで実施された調査に由来し、アンケートには居住および雇用の伝記、旅行行動、休暇旅行、および社会経済的特性に関する一連の遡及的質問が含まれています。過去にライフコースデータを分析するために生存分析が使用されてきましたが、バイレベルモデルが定式化されたのはこれが初めてです。上位レベルに因果発見アルゴリズムを含めることにより、ライフコースイベント間の因果関係を最初に特定し、次にイベント間の遷移率に影響を与える可能性のある要因を理解できます。これは、因果関係がモデル結果に基づく専門家の解釈の対象となる、より古典的な選択モデルとは大きく異なります。

Non-Determinism in TensorFlow ResNets

TensorFlow ResNetsの非決定性

著者：Miguel Morin, Matthew Willetts
URL：http://arxiv.org/abs/2001.11396v1

この論文の概要（機械翻訳による和訳）
TensorFlowのGPUでの画像分類のためにResNetをトレーニングする確率は、ネットワークの重みとバイアスの初期化や与えられたミニバッチのシーケンスではなく、GPUの非決定性によって支配されていることを示しています。テストセットの精度の標準偏差は、シードが異なる0.027と比較して、固定シードでは0.02です。ResNetモデルの標準偏差の74％近くは非決定的です。テストセットロスの場合、標準偏差の比率は80 ％以上です。これらの結果は、ディープラーニングモデルのより堅牢な評価戦略を必要とします。これは、実行間でかなりの量の結果の変動がGPUランダム性から生じる可能性があるためです。

Black-Box Saliency Map Generation Using Bayesian Optimisation

ベイジアン最適化を使用したブラックボックス顕著性マップの生成

著者：Mamuku Mokuwe, Michael Burke, Anna Sergeevna Bosman
URL：http://arxiv.org/abs/2001.11366v1

この論文の概要（機械翻訳による和訳）
顕著性マップは、特定の予測を生成するためにモデルが使用した入力領域の直感的な解釈を提供するために、コンピュータービジョンでよく使用されます。顕著性マップの生成には多くのアプローチが利用できますが、ほとんどはモデルパラメーターへのアクセスを必要とします。この作業では、ベイジアン最適化サンプリング法を使用して、モデルパラメーターへのアクセスが利用できないブラックボックスモデルの顕著性マップ生成のアプローチを提案します。このアプローチは、特定の（ブラックボックス）モデルの予測に関与するグローバルな顕著な画像領域を見つけることを目的としています。これは、画像の顕著な領域をブラックボックスモデルにローカライズしようとする摂動をモデル化するサンプリングベースのアプローチによって実現されます。結果は、顕著性マップ生成への提案されたアプローチがグリッドベースの摂動アプローチよりも優れており、モデルパラメータへのアクセスを必要とする勾配ベースのアプローチと同様に実行することを示しています。

Adversarial Training for Aspect-Based Sentiment Analysis with BERT

BERTによるアスペクトベースの感情分析のための敵対者トレーニング

著者：Akbar Karimi, Leonardo Rossi, Andrea Prati, Katharina Full
URL：http://arxiv.org/abs/2001.11316v1

この論文の概要（機械翻訳による和訳）
アスペクトベースのセンチメント分析（ABSA）は、センチメントとそのターゲットの抽出を扱います。ニューラルネットワークの一般化を支援するために、このタスクのラベル付きデータを収集するのは面倒で時間がかかる場合があります。別の方法として、実世界の例と同様のデータを、埋め込みスペースで実行される敵対プロセスを通じて人工的に生成することができます。これらの例は実際の文ではありませんが、ニューラルネットワークをより堅牢にする正則化方法として機能することが示されています。この作業では、Goodfellow et alによって提唱された敵対的トレーニングを適用します。（2014）、Xu et al。によって提案されたトレーニング後のBERT（BERT-PT）言語モデル（2019）感情分析におけるアスペクト抽出およびアスペクト感情分類の2つの主要なタスクについて。アブレーション研究により訓練後のBERTの結果を改善した後、ABSAで敵対訓練を利用するためのBERT敵対訓練（BAT）と呼ばれる新しいアーキテクチャを提案します。提案されたモデルは、両方のタスクでトレーニング後のBERTよりも優れています。私たちの知る限り、これはABSAにおける敵対的訓練の適用に関する最初の研究です。

Which way? Direction-Aware Attributed Graph Embedding

どちら？方向を意識した属性付きグラフの埋め込み

著者：Zekarias T. Kefato, Nasrullah Sheikh, Alberto Montresor
URL：http://arxiv.org/abs/2001.11297v1

この論文の概要（機械翻訳による和訳）
グラフ埋め込みアルゴリズムは、グラフの最も重要な特性を保持する低次元の連続ベクトル空間でグラフを効率的に表現（エンコード）するために使用されます。しばしば見落とされる1つの側面は、グラフが方向付けられているかどうかです。ノードの分類に最適化された高品質の表現を学習するために、ほとんどの研究では方向性を無視しています。一方、方向性を捉える研究は通常、リンク予測では効果的ですが、他のタスクではうまく機能しません。この予備調査では、慎重に設計された多目的モデルに基づいてDIAGRAMと呼ばれる、テキストが豊富な新しい方向認識アルゴリズムを示し、エッジの方向、テキストの特徴、およびノードのグラフコンテキストを保持する埋め込みを学習します。その結果、このアルゴリズムは1つのプロパティを別のプロパティと交換する必要があり、複数のネットワーク分析タスクのために高品質の表現を共同で学習します。 DIAGRAMは、2つの一般的なデータセットを使用したリンク予測およびネットワーク再構築の実験で、方向認識および忘却の両方の6つの最先端のベースラインよりも大幅に優れていることを経験的に示しています。データセット。

Improving the Robustness of Graphs through Reinforcement Learning and Graph Neural Networks

強化学習とグラフニューラルネットワークによるグラフの堅牢性の向上

著者：Victor-Alexandru Darvariu, Stephen Hailes, Mirco Musolesi
URL：http://arxiv.org/abs/2001.11279v1

この論文の概要（機械翻訳による和訳）
グラフを使用して、実世界のシステムを表し、推論することができます。全体的な特性を定量化するために、さまざまなメトリックが考案されています。一般に、以前の研究では、目的関数の価値を改善するために、動的に変更する（たとえば、エッジを追加する）問題ではなく、既存のグラフのプロパティを測定することに焦点を当てていました。この論文では、GraphNeural NetworkアーキテクチャとDeep Reinforcement Learningに基づいてグラフの堅牢性を向上させるソリューションであるRNet-DQNを紹介します。インフラストラクチャおよび通信ネットワークに関連するグラフの堅牢性を改善するためのこのアプローチの適用を調査します。 2つの目的関数を使用して堅牢性をキャプチャし、それらの値の変化を報酬信号として使用します。私たちの実験は、私たちのアプローチが、ランダムよりもはるかに優れたパフォーマンスを発揮し、場合によっては貪欲なベースラインのパフォーマンスを上回る堅牢性を改善するためのエッジ追加ポリシーを学習できることを示しています。重要なことは、学んだ政策は、それらが訓練されたものよりも大きいものを含む異なるグラフに一般化することです。素朴な貪欲なソリューションは、大きなグラフの計算に非常に高価になる可能性があるため、これは重要です。私たちのアプローチは、それに関して$ O（| V | ^ 3）$の高速化を提供します。

An Implicit Attention Mechanism for Deep Learning Pedestrian Re-identification Frameworks

深層学習歩行者再識別フレームワークのための暗黙的注意メカニズム

著者：Ehsan Yaghoubi, Diana Borza, Pendar Alirezazadeh, Aruna Kumar, Hugo Proença
URL：http://arxiv.org/abs/2001.11267v1

この論文の概要（機械翻訳による和訳）
注意は、物理的環境における特定の側面の精神的な選択に対する準備として定義されます。コンピュータビジョンドメインでは、特定の決定を得るために重要な画像/ビデオのセグメントを定義するのに役立つため、このメカニズムは最も興味深いものです。このペーパーでは、ディープラーニングフレームワークの「暗黙の」注意メカニズムを1つ紹介します。 2）推論段階の前景に焦点を合わせたサンプル。主なアイデアは、元の学習セットからインターリーブされたセグメントで構成される合成データを生成し、特定のセグメントからのみクラス情報を使用することです。学習段階では、新たに生成されたサンプルがネットワークに供給され、それらのラベルが関心領域が切り取られた場所のアイデンティティと排他的に一貫性を保ちます。したがって、モデルが一貫性のない不要な領域を持つ各アイデンティティの画像を受け取ると、ラベル一貫性のある一貫した領域に自然に最も注意を払いますが、これは効果的な受容野を学習するのと同等であることがわかりました。テスト段階では、マスクなしでサンプルが提供されます、ネットワークは自然に有害な情報を無視します。これは、パフォーマンスの観察された改善の洞察です。概念実証として、歩行者の再識別の困難な問題を検討し、このソリューションの有効性を、よく知られているRichly Annotated Pedestrian（RAP）データセットの最新技術と比較します。コードはhttps://github.com/Ehsan-Yaghoubi/reid-strong-baselineで入手できます。

HAMLET — A Learning Curve-Enabled Multi-Armed Bandit for Algorithm Selection

HAMLET-アルゴリズム選択のための学習曲線対応の多腕バンディット

著者：Mischa Schmidt, Julia Gastinger, Sébastien Nicolas, Anett Schülke
URL：http://arxiv.org/abs/2001.11261v1

この論文の概要（機械翻訳による和訳）
自動化されたアルゴリズム選択とハイパーパラメーター調整により、機械学習の適用が容易になります。従来の多腕バンディット戦略は、観測された報酬の履歴を調べて、長期的に予想される総報酬を最適化するための最も有望な武器を特定します。限られたタイムバジェットと計算リソースを検討する場合、特定の時間予算の終わりに最高の最終報酬を予想するために盗賊が将来を見据えるべきであるため、報酬のこの後方視界は不適切です。この研究では、HAMLETを導入することにより、その洞察に対処します。HAMLETは、機械学習アルゴリズムのセットの中から選択するための学習曲線の外挿と計算時間の認識により、バンディットアプローチを拡張します。結果は、HAMLETバリアント1〜3が、考慮されたタイムバジェットの大半について記録されたハイパーパラメータチューニングトレースを使用した実験で、他のバンディットベースのアルゴリズム選択戦略と同等以上のパフォーマンスを示すことを示しています。最高のパフォーマンスを発揮するHAMLET Variant 3は、学習曲線の外挿と、既知の上位の信頼限界探索ボーナスを組み合わせています。このバリアントは、1,485回の実行で95％レベルの統計的有意性を持つすべての非HAMLETポリシーよりも優れたパフォーマンスを発揮します。

Real-time Linear Operator Construction and State Estimation with Kalman Filter

カルマンフィルターを使用したリアルタイム線形演算子の構築と状態推定

著者：Tsuyoshi Ishizone, Kazuyuki Nakamura
URL：http://arxiv.org/abs/2001.11256v1

この論文の概要（機械翻訳による和訳）
カルマンフィルターは、線形ガウスシステムの状態を推定するための最も強力なツールです。さらに、この方法を使用すると、期待値最大化アルゴリズムはモデルのパラメーターを推定できます。ただし、このアルゴリズムはリアルタイムの状況では機能しません。そこで、システムの状態と遷移行列をリアルタイムで推定できる新しい手法を提案します。この手法は、観測空間での推定とオンライン学習フレームワークの2つのアイデアを利用しています。減衰振動モデルに適用すると、マトリックスを推定するための並外れた性能が得られました。また、この方法にローカライズと空間的均一性を導入し、我々の方法が高次元の時空間データのノイズを低減できることを実証しました。

Deep combinatorial optimisation for optimal stopping time problems and stochastic impulse control. Application to swing options pricing and fixed transaction costs options hedging

最適な停止時間問題と確率的インパルス制御のための深い組み合わせ最適化。スイングオプションの価格設定と固定取引コストオプションヘッジへの適用

著者：Thomas Deschatre, Joseph Mikael
URL：http://arxiv.org/abs/2001.11247v1

この論文の概要（機械翻訳による和訳）
ニューラルネットワークに基づいて、離散ランダム変数のランダム化を使用した確率制御の新しい方法が提案され、最適な停止時間問題に適用されます。アメリカのandswingオプションの価格設定に関する数値テストが行われます。インパルス制御問題の拡張について説明し、固定トランザクションコストの下でのオプションヘッジに適用します。提案されたアルゴリズムは、精度と計算時間の両方の点で既存の最高のアルゴリズムと競合しているようです。

Better Multi-class Probability Estimates for Small Data Sets

小さいデータセットのより良いマルチクラス確率推定

著者：Tuomo Alasalmi, Jaakko Suutala, Heli Koskimäki, Juha Röning
URL：http://arxiv.org/abs/2001.11242v1

この論文の概要（機械翻訳による和訳）
多くの分類アプリケーションでは、適切なクラス分離に加えて正確な確率推定が必要ですが、多くの場合、分類器は後者にのみ焦点を合わせて設計されています。キャリブレーションは、後処理により確率推定を改善するプロセスですが、一般的に使用されるキャリブレーションアルゴリズムは小さなデータセットではうまく機能せず、分類タスクはバイナリであると想定します。これらの制限は両方とも、実際の適用性を制限します。以前に導入されたデータ生成およびグループ化アルゴリズムは、小さなデータセットによって引き起こされる問題を軽減します。この記事では、他の制限を解決するマルチクラス問題への適用も可能であることを示します。私たちの実験は、提案されたアプローチを使用して較正誤差を減らすことができ、追加の計算コストが許容できることを示しています。

Learning Discrete Distributions by Dequantization

逆量子化による離散分布の学習

著者：Emiel Hoogeboom, Taco S. Cohen, Jakub M. Tomczak
URL：http://arxiv.org/abs/2001.11235v1

この論文の概要（機械翻訳による和訳）
通常、メディアはデジタル形式で保存されるため、ディスクリートです。深層学習で成功した多くの深層分布モデルは、密度、つまり連続確率変数の分布を学習します。離散データの単純な最適化により、任意の高い尤度が得られ、代わりに、データポイントにノイズを追加することが標準的な手法になりました。目的：重要度加重（iw）逆量子化およびR ‘enyi逆量子化さらに、より柔軟な逆量子化分布のための自己回帰逆量子化（ARD）を導入します。 CIFAR10の1次元あたり3.06ビットの負の対数尤度。これは、私たちの知る限りでは、サンプリングに自己回帰逆関数を必要としない分布モデルの中で最先端のものです。

Survey of Deep Reinforcement Learning for Motion Planning of Autonomous Vehicles

自律車両の運動計画のための深層強化学習の調査

著者：Szilárd Aradi
URL：http://arxiv.org/abs/2001.11231v1

この論文の概要（機械翻訳による和訳）
自律走行車の分野における学術研究は、センサー技術、V2X通信、安全性、セキュリティ、意思決定、制御、さらには法的および標準化規則などのいくつかのトピックに関連して、近年高い人気を博しています。古典的な制御設計アプローチに加えて、人工知能と機械学習法はこれらの分野のほとんどすべてに存在します。研究の別の部分は、戦略的決定、軌道計画、制御など、MotionPlanningのさまざまなレイヤーに焦点を当てています。機械学習自体の幅広い技術が開発されており、この記事ではこれらの分野の1つである深層強化学習（DRL）について説明します。このペーパーでは、階層的なモーションプランニングの問題に対する洞察を提供し、DRLの基本について説明しています。そのようなシステムを設計する主な要素は、環境のモデリング、モデリングの抽象化、状態と知覚モデルの説明、適切な報酬、および基礎となるニューラルネットワークの実現です。このペーパーでは、車両モデル、シミュレーションの可能性、および計算要件について説明します。さまざまなレイヤーと観測モデルの戦略的決定、たとえば、連続状態と離散状態の表現、グリッドベースのソリューション、カメラベースのソリューションが提示されます。このペーパーでは、車の追従、車線維持、軌道追従、合流、密集した交通での運転など、さまざまなタスクと自動運転のレベルによって体系化された最新のソリューションを調査します。。

How Does BN Increase Collapsed Neural Network Filters?

BNは折りたたまれたニューラルネットワークフィルターをどのように増加させますか？

著者：Sheng Zhou, Xinjiang Wang, Wenjie Li, Litong Feng, Ping Luo
URL：http://arxiv.org/abs/2001.11216v1

この論文の概要（機械翻訳による和訳）
ディープニューラルネットワーク（DNN）のスパース性を改善することは、ネットワーク圧縮に不可欠であり、多くの注目を集めています。この作業では、フィルター崩壊と呼ばれる有害なスパース化プロセスを開示します。これは、バッチ正規化（BN）および修正線形活性化関数（ReLU、LeakyReLUなど）を備えたDNNで一般的です。これは、$ L_1 $などのスパース性を誘発する明示的な正則化がなくても発生します。この現象は、BNの正規化効果が原因で発生します。これにより、パラメータ空間にトレーニング不可能な領域が生じ、結果としてネットワーク容量が減少します。この現象は、ネットワークが大きな学習率（LR）または適応LRスケジューラーでトレーニングされ、ネットワークが微調整されると、より顕著になります。高い勾配ノイズを伴うSGDの更新中にBNのパラメーターがまばらになる傾向があり、スパース化確率が学習率の2乗に比例し、BNのスケールパラメーターの2乗に反比例することを分析的に証明します。望ましくないフィルターの崩壊を防ぐために、トレーニング中に飽和するにつれてBNパラメーターを再度トレーニング可能にしながら、BNと同じ表現能力を持つ、ポストシフトBN（psBN）と呼ばれるシンプルで効果的なアプローチを提案します。 psBNを使用すると、CIFAR-10での分類やMS-COCO2017でのオブジェクト検出などのさまざまなタスクで、折りたたまれたフィルターを回復し、モデルのパフォーマンスを向上させることができます。

TCMI: a non-parametric mutual-dependence estimator for multivariate continuous distributions

TCMI：多変量連続分布のためのノンパラメトリック相互依存推定量

著者：Benjamin Regler, Matthias Scheffler, Luca M. Ghiringhelli
URL：http://arxiv.org/abs/2001.11212v1

この論文の概要（機械翻訳による和訳）
関連する機能、つまりプロセスまたはシステムのプロパティを決定する駆動変数の識別は、エントリが多数の変数で記述されているデータセットの分析の重要な部分です。非線形統計依存関係の関連性を定量化するための推奨される尺度は相互情報であり、入力確率分布として必要です。特に長さやエネルギーなどの実数値のデータサンプルの場合、確率分布は限られたデータから確実にサンプリングおよび推定することはできません。ここでは、累積確率分布に基づいた相互依存関係の関連性の尺度である、累積累積相互情報（TCMI）を紹介します。 TCMIは、サンプルデータから直接推定でき、カーディナリティの異なる機能セット間の比較とランキングを容易にするノンパラメトリックで堅牢かつ決定的な尺度です。 TCMIによって誘導されるランク付けにより、機能の選択、つまりプロセスまたはシステムのプロパティに関連する統計的な関連機能のセットの識別が可能になり、データサンプルの数と機能サブセットのカーディナリティが考慮されます。シミュレーションデータを使用して測定値のパフォーマンスを評価し、そのパフォーマンスを同様の多変量依存性測定値と比較し、標準データセットのセットおよび材料科学の一般的なシナリオでの機能選択方法の有効性を示します。

Finite-time Analysis of Kullback-Leibler Upper Confidence Bounds for Optimal Adaptive Allocation with Multiple Plays and Markovian Rewards

多重プレイとマルコフ報酬による最適適応配分のためのKullback-Leibler上信頼限界の有限時間解析

著者：Vrettos Moulos
URL：http://arxiv.org/abs/2001.11201v1

この論文の概要（機械翻訳による和訳）
マルコフ報酬と複数のプレイを含む古典的な確率的多腕バンディット問題の拡張を研究します。この問題に取り組むために、各段階で、マルコフの武器の定常的な期待報酬について、Kullback-Leibler発散率を使用して、サンプル平均と信頼限界の計算を組み合わせたインデックスベースの適応割り当てルールを検討します。マルコフ連鎖の1つのパラメーターの指数族から生成された報酬について、この適応割り当て規則から生じる後悔の有限時間の上限を提供します。これは、時間の地平線に対する後悔の対数依存性を明らかにし、漸近的に最適です。分析のために、マルコフ連鎖の最大不等式を含むマルコフ連鎖のいくつかの集中結果を考案します。分析の副産物として、複数のプレイの場合の漸近的に最適な有限時間の保証、および確率密度の1つのパラメーターの指数ファミリーから引き出されたIID報酬も確立します。

A Hybrid Two-layer Feature Selection Method Using GeneticAlgorithm and Elastic Net

遺伝的アルゴリズムとエラスティックネットを使用したハイブリッド2層特徴選択法

著者：Fatemeh Amini, Guiping Hu
URL：http://arxiv.org/abs/2001.11177v1

この論文の概要（機械翻訳による和訳）
機械学習の重要な前処理ステップとしての特徴選択は、高次元の特徴空間データセットから代表的な予測変数を決定し、予測精度を向上させることを目的としています。しかし、観測の数と比較して、特徴空間の次元の増加は、計算効率および予測性能に関して、多くの既存の特徴選択方法に対する厳しい挑戦を引き起こします。このホワイトペーパーでは、ラッパーと埋め込みメソッドを組み合わせて予測子の適切なサブセットを構築する、新しいハイブリッド2レイヤー機能選択アプローチを紹介します。提案手法の第1層では、遺伝的アルゴリズム（GA）が予測子の最適サブセットを検索するラッパーとして採用されており、予測子の数と予測誤差を削減することを目的としています。メタヒューリスティックアプローチの1つとして、計算効率のためにGAが選択されますが、GAは最適性を保証しません。この問題に対処するため、提案された方法に第2層が追加され、残りの冗長/無関係な予測子を排除して予測精度を改善します。 ElasticNet（EN）は、正則化プロセスと時間効率のペナルティ条件を調整する柔軟性のために、第2層の埋め込み方法として選択されました。このハイブリッド2層アプローチは、予測の数と観測の数の比率が異なるデータセットの複数のサブセットで構成される、NAM集団のMaizegeneticデータセットに適用されています。数値結果は、提案されたモデルの優位性を確認します。

Kernel Selection for Modal Linear Regression: Optimal Kernel and IRLS Algorithm

モーダル線形回帰のカーネル選択：最適なカーネルとIRLSアルゴリズム

著者：Ryoya Yamasaki, Toshiyuki Tanaka
URL：http://arxiv.org/abs/2001.11168v1

この論文の概要（機械翻訳による和訳）
モーダル線形回帰（MLR）は、条件付きモード予測子を線形モデルとして取得する方法です。 2つの観点からMLRのカーネル選択を調査します：「どのカーネルがより小さなエラーを達成しますか？」「どのカーネルが計算上効率的ですか？」最初に、結果のMLRパラメータの漸近平均二乗誤差を最小化するという意味で、Biweightカーネルが最適であることを示します。この結果は、MLRの漸近統計的動作の洗練された分析から導き出されています。第二に、反復再重み付け最小二乗アルゴリズム（IRLS）の収束が保証されるカーネルクラスを提供し、特にEpanechnikovカーネルを持つIRLSが有限の反復で終了することを証明します。シミュレーション研究により、Biweightカーネルを使用すると推定精度が向上し、Epanechnikovカーネルを使用すると計算効率が向上することが経験的に検証されました。我々の結果は、カーネル選択のガイドラインを提供することにより、既存の研究がしばしばガウスカーネルとそれに特化したモーダルEMアルゴリズムに固執するMLRを改善します。

AVATAR — Machine Learning Pipeline Evaluation Using Surrogate Model

アバター-サロゲートモデルを使用した機械学習パイプライン評価

著者：Tien-Dung Nguyen, Tomasz Maszczyk, Katarzyna Musial, Marc-Andre Zöller, Bogdan Gabrys
URL：http://arxiv.org/abs/2001.11158v1

この論文の概要（機械翻訳による和訳）
機械学習（ML）パイプラインの評価は、自動MLパイプラインの構成および最適化中に不可欠です。 Auto-Weka、Auto-sklearn、TPOTで実装されるベイジアンベースおよび遺伝子ベースの最適化などの以前の方法は、パイプラインを実行することで評価するため、これらの方法のパイプライン構成と最適化には、それらを防ぐために膨大な時間が必要です複雑なパイプラインを探索して、より良い予測モデルを見つけます。この研究課題をさらに調査するために、生成されたパイプラインの多くが無効であり、それらを実行してパイプラインが適切かどうかを調べる必要がないことを示す実験を実施しました。この問題に対処するために、代理モデル（AVATAR）を使用してMLパイプラインの有効性を評価する新しい方法を提案します。 AVATARは、無効なパイプラインを迅速に無視することにより、自動MLパイプラインの構成と最適化を加速します。私たちの実験は、AVATARが複雑なパイプラインの評価において、実行を必要とする従来の評価アプローチと比較してより効率的であることを示しています。

Multi-Participant Multi-Class Vertical Federated Learning

複数参加者、複数クラスの垂直連合学習

著者：Siwei Feng, Han Yu
URL：http://arxiv.org/abs/2001.11154v1

この論文の概要（機械翻訳による和訳）
連合学習（FL）は、複数の参加者からローカルに保存されたデータを使用して、集合的な機械学習モデルをトレーニングするためのプライバシー保護パラダイムです。垂直連合学習（VFL）は、ラベル情報が1人の参加者によって所有されている間に、同じサンプルIDスペースを共有しているが異なる機能スペースを持っている参加者の場合を扱います。 VFLの現在の研究では2人の参加者のみがサポートされており、主にバイナリクラスのロジスティック回帰の問題に焦点が当てられています。この論文では、複数の参加者が関与するマルチクラスVFLの問題に対するマルチ参加者マルチクラス垂直連合学習（MMVFL）フレームワークを提案します。 MMVFLは、マルチビュー学習（MVL）の概念を拡張し、所有者から他のVFL参加者へのプライバシーを保持した方法でのラベル共有を可能にします。 MMVFLの有効性を実証するために、機能選択スキームがMMVFLに組み込まれ、監視対象機能選択とMVLベースのアプローチとのパフォーマンスを比較しています。実世界のデータセットの実験結果は、MMVFLが複数のVFL参加者間でラベル情報を効果的に共有し、既存のアプローチのマルチクラス分類パフォーマンスに一致することを示しています。

A Graph-Based Approach for Active Learning in Regression

回帰における能動学習のためのグラフベースのアプローチ

著者：Hongjing Zhang, S. S. Ravi, Ian Davidson
URL：http://arxiv.org/abs/2001.11143v1

この論文の概要（機械翻訳による和訳）
アクティブラーニングは、ラベル付けされていないプールから最も重要なデータポイントに注釈を付けて選択することにより、ラベル付けの労力を減らすことを目的としており、ヒューマンマシンインタラクションの例です。能動学習は、分類とランク付けの問題について広く研究されてきましたが、回帰問題については比較的研究されていません。回帰法の既存のアクティブ学習のほとんどは、アクティブ学習の各反復で学習した回帰関数を使用して、クエリする次の有益なポイントを選択します。これにより、ノイズの多いラベルの処理、パラメータの不確実性、最初に偏ったトレーニングデータの克服など、いくつかの課題が生じます。代わりに、シーケンシャル回帰とバッチモードアクティブ回帰の両方を新しい2部グラフ最適化問題として定式化する、機能重視のアプローチを提案します。ノイズのない設定とノイズの多い設定の両方で実験を行います。ベンチマークデータセットに関する実験結果は、提案されたアプローチの有効性を示しています。

Adversarial Attacks on Convolutional Neural Networks in Facial Recognition Domain

顔認識ドメインにおける畳み込みニューラルネットワークに対する敵対攻撃

著者：Yigit Alparslan, Jeremy Keim-Shenk, Shweta Khade, Rachel Greenstadt
URL：http://arxiv.org/abs/2001.11137v1

この論文の概要（機械翻訳による和訳）
多数の最近の研究により、攻撃者が元のサンプルに摂動を追加し、分類器がサンプルを誤分類する敵対的な例によって、Deep Neural Network（DNN）分類器がだまされる方法が示されています。 DNNを実生活で脆弱にする敵対的な攻撃は、自律走行車、マルウェアフィルター、または生体認証システムが正しく機能しない結果として、深刻な脅威となります。この論文では、Fast Gradient Sign Methodを適用して、顔の画像データセットに摂動を導入し、自分で訓練した別の分類器で出力をテストして、この方法の伝達性を分析します。次に、顔認識データセットでさまざまな攻撃アルゴリズムを作成し、ターゲットを特定しないブラックボックスアプローチを開発して、最小限の敵対的知識を想定し、顔認識領域のDNNの堅牢性をさらに評価します。単一の最適なピクセルを大量に変更するか、すべてのピクセルを少量変更するか、これら2つの攻撃手法を組み合わせて検討します。単一ピクセル攻撃では、実際のクラスの分類子の信頼レベルが平均で約15％低下しましたが、全ピクセル攻撃はより成功し、最大84％の不確実性の低下と、誤分類率81.6％を達成しました最高レベルの摂動でテストした攻撃のこれらの高レベルの摂動があったとしても、顔画像は人間にとってかなり明確に識別可能なままでした。私たちの研究が、特に顔認識ドメインにおいて、DNNに対する敵対的攻撃とそれらに対抗するための防御メカニズムの研究を促進するのに役立つことを願っています。

Blocked Clusterwise Regression

ブロックされたクラスターごとの回帰

著者：Max Cytrynbaum
URL：http://arxiv.org/abs/2001.11130v1

この論文の概要（機械翻訳による和訳）
計量経済学の最近の文献では、各断面単位を1次元の離散潜在型に割り当てることにより、パネルデータの断面不均一性を観察していません。このようなモデルは、回帰クラスタリング法による推定と推論を可能にすることが示されています。この論文は、この文献で研究されているクラスター化された不均一性モデルは、パネルが有意に離散的な断面構造を有する場合でも、ひどく誤って指定される可能性があるという発見に基づいています。この問題に対処するために、各ユニットに異なる共変量に対する応答タイプを記述する複数の不完全に相関した潜在変数を持たせることにより、離散的な観測されていない不均一性に対する以前のアプローチを一般化します。モデルのk-meansstyle推定器の推論結果を提供し、各潜在変数の数クラスターを共同で選択するための情報基準を開発します。モンテカルロシミュレーションは、理論的な結果を確認し、推定とモデル選択の有限サンプルパフォーマンスについて直感を与えます。また、過剰に指定された数のクラスターでクラスター化の理論に貢献し、この設定の新しい収束率を導き出します。我々の結果は、クラスターの数が過剰に指定されている場合、過剰適合は深刻なインク平均スタイルの推定量になる可能性があることを示唆しています。

Multi-Marginal Optimal Transport Defines a Generalized Metric

多限界最適輸送は、一般化されたメトリックを定義します

著者：Liang Mi, José Bento
URL：http://arxiv.org/abs/2001.11114v1

この論文の概要（機械翻訳による和訳）
多重限界最適輸送（MMOT）問題が一般化されたメトリックを定義することを証明します。さらに、MMOTによって誘導される距離は、一般化された三角形の不等式を満たしていることを証明します。

GradientDICE: Rethinking Generalized Offline Estimation of Stationary Values

GradientDICE：定常値の一般化されたオフライン推定の再考

著者：Shangtong Zhang, Bo Liu, Shimon Whiteson
URL：http://arxiv.org/abs/2001.11113v1

この論文の概要（機械翻訳による和訳）
ターゲットポリシーの状態分布とポリシー外の強化学習のサンプリング分布の間の密度比を推定するためのGradientDICEを提示します。 GradientDICEは、このような密度比を推定するための最新技術であるGenDICE（Zhanget et al。、2020）のいくつかの問題を修正します。導入されているため、希望する解決策を見つけるための主双対アルゴリズムは保証されていません。ただし、表形式であってもGenDICEの一貫性を確保するには、このような非線形性が不可欠です。これは、GenDICEの最適化問題の元の定式化に起因する基本的な矛盾です。 GradientDICEでは、Perron-Frobeniusの定理を使用してGenDICEの発散の使用を排除することにより、GenDICEとは異なる目的を最適化します。その結果、パラメーター化の非線形性は、線形関数近似で証明可能な収束性があるGradientDICEには必要ありません。

Simulation of electron-proton scattering events by a Feature-Augmented and Transformed Generative Adversarial Network (FAT-GAN)

特徴増強および変換生成敵対ネットワーク（FAT-GAN）による電子-陽子散乱イベントのシミュレーション

著者：Yasir Alanazi, N. Sato, Tianbo Liu, W. Melnitchouk, Michelle P. Kuchera, Evan Pritchard, Michael Robertson, Ryan Strauss, Luisa Velasco, Yaohang Li
URL：http://arxiv.org/abs/2001.11103v1

この論文の概要（機械翻訳による和訳）
生成的敵対ネットワーク（GAN）技術を適用して、基礎となる粒子のダイナミクスに関する理論的仮定のない電子-陽子散乱における粒子生成をシミュレートするイベントジェネレータを構築します。 GANイベントシミュレータを効率的にトレーニングすることの難しさは、粒子の物理的特性の分布の複雑なパターンを学習することにあります。識別器の感度を向上させる拡張機能の新しいFeature-Augmented and Transformed GAN（FAT-GAN）は、ドメインベースの理論的仮定から派生した入力を必要とせずに、電子散乱を含む最終状態電子運動量の分布を忠実に再現できます。開発された技術は、ジェファーソンラボ12 GeVプログラムと将来の電子イオン衝突型加速器の科学を後押しする上で重要な役割を果たすことができます。

Ensemble Grammar Induction For Detecting Anomalies in Time Series

時系列の異常を検出するためのアンサンブル文法誘導

著者：Yifeng Gao, Jessica Lin, Constantin Brif
URL：http://arxiv.org/abs/2001.11102v1

この論文の概要（機械翻訳による和訳）
時系列の異常検出は重要なタスクであり、海外のさまざまなドメインでアプリケーションを使用しています。近年、多くのアプローチが提案されてきましたが、多くの場合、異常の長さを事前に把握し、入力パラメータとして提供する必要があります。そのような情報はしばしば事前に知られていないか、データに異なる長さの異常が共存する可能性があるため、これはアルゴリズムの実用性を制限します。この制限に対処するために、以前は、文法誘導に基づく線形時間異常検出アルゴリズムが提案されてきました。アルゴリズムは可変長パターンを見つけることができますが、離散化ステップで少なくとも2つのパラメーターの値を事前に選択する必要があります。これらのパラメータ値を適切に選択する方法は、未解決の問題です。このホワイトペーパーでは、アンサンブル学習を利用した文法誘導ベースの異常検出方法を紹介します。異常検出にパラメータ値の特定の選択を使用する代わりに、この方法は、異なるパラメータ値を使用して取得した結果のセットに基づいて最終結果を生成します。提案されたアンサンブルアプローチは、パラメーター値の選択のさまざまな基準を使用して、既存の文法誘導ベースのアプローチよりも優れていることを示しています。また、提案されたアプローチが、最先端の距離ベースの異常検出アルゴリズムのパフォーマンスと同様のパフォーマンスを達成できることを示します。

Urban2Vec: Incorporating Street View Imagery and POIs for Multi-Modal Urban Neighborhood Embedding

Urban2Vec：マルチモーダル都市近隣埋め込みのためのストリートビュー画像とPOIの組み込み

著者：Zhecheng Wang, Haoyuan Li, Ram Rajagopal
URL：http://arxiv.org/abs/2001.11101v1

この論文の概要（機械翻訳による和訳）
本質的なパターンを理解し、都市の時空間特性を予測するには、都市の周辺地域の包括的な表現が必要です。既存の作業は、地域間または地域内の接続性に依存して近隣表現を生成しましたが、近隣内の有益でありながら異種のデータを完全に活用することはできませんでした。この作業では、Urban2Vecを提案します。これは、ストリートビュー画像と興味のある（POI）データの両方を学習埋め込みに組み込む、教師なしマルチモーダルフレームワークです。具体的には、畳み込みニューラルネットワークを使用して、地理空間類似性を維持しながらストリートビュー画像から視覚的特徴を抽出します。さらに、各POIを、そのカテゴリ、評価、およびレビュー情報を含む単語の袋としてモデル化します。自然言語処理の埋め込みを文書化するために、近傍（「文書」）とベクトル空間内の周囲のPOIからの単語との意味的類似性を確立します。 Urban2Vecは、視覚、テキスト、地理空間情報を隣接する表現に共同でエンコードすることにより、ベースラインモデルよりも優れたパフォーマンスを実現し、ダウンストリーム予測タスクの完全に監視された方法に匹敵します。米国の3つの大都市圏での広範な実験も、モデルの解釈可能性、一般化機能、および近隣の類似性分析におけるその価値を実証しています。

stream-learn — open-source Python library for difficult data stream batch analysis

stream-learn-困難なデータストリームバッチ分析用のオープンソースPythonライブラリ

著者：Paweł Ksieniewicz, Paweł Zyblewski
URL：http://arxiv.org/abs/2001.11077v1

この論文の概要（機械翻訳による和訳）
stream-learnは、scikit-learnと互換性のあるPythonパッケージであり、ドリフトおよび不均衡なデータストリーム分析用に開発されています。その主なコンポーネントはストリームジェネレーターであり、3つの主要なコンセプトドリフトタイプ（つまり、突然、漸進的、漸進的ドリフト）のそれぞれを繰り返しバージョンまたは非繰り返しバージョンに組み込むことができる合成データストリームを生成できます。このパッケージを使用すると、確立された評価方法論に従ってテストを実施することができます（つまり、Test-Then-TrainおよびPrequential）。さらに、単純な分類子と、最新のチャンクベースおよびオンライン分類子の両方を含む、データストリーム分類に適応した推定器が実装されています。計算効率を改善するために、パッケージは、不均衡なバイナリ分類タスクの予測メトリックの独自の実装を利用します。

Safe Predictors for Enforcing Input-Output Specifications

入出力仕様を実施するための安全な予測子

著者：Stephen Mell, Olivia Brown, Justin Goodwin, Sung-Hyun Son
URL：http://arxiv.org/abs/2001.11062v1

この論文の概要（機械翻訳による和訳）
アルゴリズムトレーニングの前、最中、および後に、入出力仕様の集合と一貫性があることが保証されている、構築による修正ニューラルネットワーク（および他の機械学習モデル）を設計するためのアプローチを示します。私たちの方法は、互換性のある制約の各セットに対して制約付き予測子を設計し、それらの予測の凸の組み合わせを介してそれらを安全に結合することを含む。合成データセットと航空機の衝突回避問題に関するアプローチを示します。

Bayesian Reasoning with Deep-Learned Knowledge

深層学習知識によるベイジアン推論

著者：Jakob Knollmüller, Torsten Enßlin
URL：http://arxiv.org/abs/2001.11031v1

この論文の概要（機械翻訳による和訳）
複雑なタスクでベイジアン推論を実行するために、訓練されたディープニューラルネットワークの内部化された理解にアクセスします。独立して訓練されたネットワークは、ベイジアン推論問題に関して定式化された元の範囲外の質問に共同で回答するように配置されています。これは、結果に不確実性を与える変分推論でほぼ解決します。独立して訓練されたネットワークを組み合わせて条件付きジェネレーターからサンプリングし、複数の制約を同時に含む謎を解き、人間の顔の高解像度画像のコンテキストで従来のノイズの多い測定と深い学習知識を組み合わせて、次のタスクにこの方法でアプローチする方法を示します。

Improving Language Identification for Multilingual Speakers

多言語話者の言語識別の改善

著者：Andrew Titus, Jan Silovsky, Nanxin Chen, Roger Hsiao, Mary Young, Arnab Ghoshal
URL：http://arxiv.org/abs/2001.11019v1

この論文の概要（機械翻訳による和訳）
音声言語識別（LID）テクノロジは、近年、大きく異なる言語の識別から、非常に類似した言語または同じ言語の方言の識別にまで改善されました。しかし、ほとんど無視されてきた1つの側面は、LIDテクノロジーを利用する多くのシステムの主な対象読者であるにもかかわらず、多言語スピーカーの言語の差別です。この作業で示すように、LIDシステムは、ほとんどの言語の組み合わせに対して高い平均精度を持ち、アクセントのある音声が存在する場合、他の言語のパフォーマンスを大幅に低下させます。この問題に対処するには、音響LIDモデルに粗視化されたターゲットを使用し、その出力をコンテキスト認識モデルの相互作用コンテキスト信号と統合して、システムを各ユーザーに合わせます。この複合システムは、すべての言語の組み合わせで平均97％の精度を達成し、ベースラインと比較して最悪の場合の精度を60％以上改善します。

Functional Sequential Treatment Allocation with Covariates

共変量による機能的逐次治療配分

著者：Anders Bredahl Kock, David Preinerstorfer, Bezirgen Veliyev
URL：http://arxiv.org/abs/2001.10996v1

この論文の概要（機械翻訳による和訳）
共変量を持つ多腕バンディット問題を考えます。共変量ベクトルの実現を考えると、最高の条件付き期待値で治療を標的にする代わりに、意思決定者は、条件付き潜在的結果分布の一般的な機能、例えば、条件付き分位、トリム平均、不平等などの社会経済的機能を最大化する治療を標的にします、福祉または貧困対策。この問題に対して予想される後悔の下限を開発し、ほぼ最小最大の割り当てポリシーを構築します。

The Case for Bayesian Deep Learning

ベイジアン深層学習の事例

著者：Andrew Gordon Wilson
URL：http://arxiv.org/abs/2001.10995v1

この論文の概要（機械翻訳による和訳）
ベイズのアプローチの重要な特徴は、事前のベイズ規則ではなく、最適化ではなく周辺化です。ベイジアン推論は、特にディープニューラルネットワークにとって説得力があります。（1）ニューラルネットワークは通常、データによって不十分に指定されており、パラメータの異なる設定に対応する多くの異なるが高性能なモデルを表すことができます。（2）ディープアンサンブルは、ベイジアン手法と競合するアプローチと誤解されていますが、ベイジアン辺縁化の近似と見なすことができます。（3）ニューラルネットワークの構造は、機能空間で構造化された事前分布を引き起こします。（4）フラット領域が高次元空間で大きなボリュームを占有し、各異なるソリューションがベイジアンモデルの平均（5）ベイジアンディープラーニングの最近の実用的な進歩により、スケーラビリティを維持しながら、標準トレーニングと比較して精度とキャリブレーションが改善されました。

An Upper Bound of the Bias of Nadaraya-Watson Kernel Regression under Lipschitz Assumptions

Lipschitz仮定の下でのNadaraya-Watsonカーネル回帰のバイアスの上限

著者：Samuele Tosatto, Riad Akrour, Jan Peters
URL：http://arxiv.org/abs/2001.10972v2

この論文の概要（機械翻訳による和訳）
Nadaraya-Watsonカーネル推定器は、その単純さのおかげで、最も一般的な非パラメーター回帰手法の1つです。その漸近的バイアスは、1969年にRosenblattによって研究され、多くの関連文学で報告されています。ただし、Rosenblattの分析は、無限小帯域幅に対してのみ有効です。対照的に、本論文では、有限の帯域幅を保持するバイアスの上限を提案します。さらに、古典的な分析に反して、回帰関数の不連続な一次導関数を可能にし、多次元領域の境界を拡張し、回帰関数が存在する場合、および既知の場合はより厳しい境界を取得するために、回帰関数の境界の知識を含めます。この作業には、エラーに関するいくつかの厳しい保証が必要な分野での潜在的な用途があると考えています

REST: Robust and Efficient Neural Networks for Sleep Monitoring in the Wild

REST：野生での睡眠モニタリングのための堅牢で効率的なニューラルネットワーク

著者：Rahul Duggal, Scott Freitas, Cao Xiao, Duen Horng Chau, Jimeng Sun
URL：http://arxiv.org/abs/2001.11363v1

この論文の概要（機械翻訳による和訳）
近年、医療分野での深層学習技術の統合に大きな注目が集まっています。ただし、家庭の健康状態を監視するためのディープラーニングモデルを安全かつ実用的に展開するには、2つの重要な課題に対処する必要があります。モデルは（1）ノイズに対して堅牢である必要があります。（2）コンパクトでエネルギー効率が高い。 REST、1）スペクトルの正則化によるニューラルネットワークのリプシッツ定数の敵対的トレーニングと制御、2）スパース性の正則化によるニューラルネットワークの圧縮を同時に介して両方の問題に取り組む新しい方法を提案します。 RESTは、ノイズの存在下で元のフルサイズモデルを大幅に上回る非常に堅牢で効率的なモデルを生成することを実証します。単一チャネル脳波（EEG）を介した睡眠病期分類タスクの場合、RESTモデルは0.67vsのマクロF1スコアを達成します。 0.39は、ガウスノイズの存在下で最新のモデルによって達成され、2つの大きな実世界のEEGデータセットで19倍のパラメーター削減と15倍のMFLOPS削減を実現します。これらのモデルをスマートフォンのAndroidアプリケーションに展開することで、RESTにより最大17倍のエネルギー削減と9倍の高速推論を実現できることが定量的に観察されます。 https://github.com/duggalrahul/RESTのコードリポジトリをこのペーパーでオープンソース化します。

Maximum likelihood estimation and uncertainty quantification for Gaussian process approximation of deterministic functions

決定論的関数のガウス過程近似のための最尤推定と不確実性定量化

著者：Toni Karvonen, George Wynne, Filip Tronarp, Chris J. Oates, Simo Särkkä
URL：http://arxiv.org/abs/2001.10965v1

この論文の概要（機械翻訳による和訳）
ガウス過程回帰モデルの普遍性にもかかわらず、共分散カーネルのパラメーターは通常データセットから推定する必要があるという事実を説明する理論的な結果はほとんどありません。この記事は、ノイズのないデータセットを使用したガウス過程回帰のコンテキストでの最初の理論的分析の1つを提供します。具体的には、Sobolevカーネル（Mat ‘ernkernelなど）のスケールパラメーターが最尤法によって推定されるシナリオを検討します。スケールパラメーターのみの最尤推定は、データ生成関数の滑らかさと、モデル。分析は、ノンパラメトリック回帰と散布データ補間の手法の組み合わせに基づいています。理論的な結果を裏付ける実験結果が提供されます。

Examining the Benefits of Capsule Neural Networks

Capsule Neural Networksの利点を調べる

著者：Arjun Punjabi, Jonas Schmid, Aggelos K. Katsaggelos
URL：http://arxiv.org/abs/2001.10964v1

この論文の概要（機械翻訳による和訳）
Capsuleネットワークは、最近開発されたニューラルネットワークのクラスであり、従来の畳み込みニューラルネットワークのいくつかの欠陥に対処する可能性があります。標準のスカラーアクティベーションをベクトルに置き換え、人工ニューロンを新しい方法で接続することにより、カプセルネットワークはコンピュータービジョンアプリケーションの次の素晴らしい開発を目指しています。ただし、これらのネットワークが従来のネットワークと実際に異なる動作をするかどうかを判断するには、カプセル機能の違いを調べる必要があります。この目的のために、カプセル機能を解明し、それらが最初の出版物に記載されているように機能するかどうかを判断する目的で、いくつかの分析を実行します。まず、カプセル機能と畳み込みニューラルネットワーク機能を視覚的に比較するために、詳細な視覚化分析を実行します。次に、カプセル機能がベクトルコンポーネント全体で情報をエンコードし、カプセルアーキテクチャのどのような変更が最も利点を提供するかを検討します。最後に、カプセル機能が視覚的変換を介してクラスオブジェクトのインスタンス化パラメーターをどの程度うまくエンコードできるかを調べます。

Reducing complexity and unidentifiability when modelling human atrial cells

人間の心房細胞をモデル化する際の複雑さと識別不能性の低減

著者：C. Houston, B. Marchand, L. Engelbert, C. D. Cantwell
URL：http://arxiv.org/abs/2001.10954v1

この論文の概要（機械翻訳による和訳）
心臓モデリングにおける細胞活動電位の数学モデルは、特に個々のイオンチャネル電流の開閉を制御するゲーティング動力学において、ますます複雑になっています。心臓モデルは、臨床的意思決定を知らせるために個別化医療での使用に向けて前進しているため、キャリブレーションから実験データまでのパラメーター推定値の不確実性を理解することが重要です。この研究では、近似ベイズ計算を適用して、2つの既存のヒト心房細胞モデルの4つのイオンチャネルのゲーティング速度を元のデータセットに再調整し、利用可能な実験データから単一の一意の値を選択して、不確実性の尺度と潜在的な問題の指標を提供します。存在する不確実性を低減するために、2つのアプローチが調査されます。モデルをより完全なデータセットに再調整し、制約の少ないパラメーターの少ない複雑な定式化を使用します。再調整されたモデルは、活動電位への全体的な影響を研究するためにフルセルモデルに挿入されます。より完全なデータセットを使用しても、パラメータ推定値に存在する不確実性は排除されません。特に高速のナトリウム電流の複雑さの少ないモデルは、より低いパラメーター不確実性と改善された計算速度とともに、実験データによりよく適合しました。

On Constraint Definability in Tractable Probabilistic Models

実行可能確率モデルにおける制約定義可能性について

著者：Ioannis Papantonis, Vaishak Belle
URL：http://arxiv.org/abs/2001.11349v1

この論文の概要（機械翻訳による和訳）
制約を組み込むことは、確率的機械学習の主要な関心事です。さまざまな問題を解決するには、マップ上のルートのモデリングからローン予測の承認まで、制約を推論と予測を統合する必要があります。前者では、マップ上のノード間の物理パスの存在を尊重するように予測モデルを要求する場合があり、後者では、結果がバイアスの影響を受けないことを保証する公平性制約を予測モデルが要求する場合があります。大まかに言って、制約は確率的、論理的、または因果関係がありますが、最も重要な課題は、宣言されたすべての制約を処理するモデルを学習できるかどうかとその方法を決定することです。私たちの知る限り、これは主に未解決の問題です。この論文では、制約を取り入れながら和積ネットワークなどの扱いやすい確率モデルの学習がどのように可能であるかについての数学的調査を検討します。

Unsupervised Anomaly Detection for X-Ray Images

X線画像の教師なし異常検出

著者：Diana Davletshina, Valentyn Melnychuk, Viet Tran, Hitansh Singla, Max Berrendorf, Evgeniy Faerman, Michael Fromm, Matthias Schubert
URL：http://arxiv.org/abs/2001.10883v1

この論文の概要（機械翻訳による和訳）
医療（画像）データのラベルを取得するには、希少で高価な専門家が必要です。さらに、あいまいな症状のために、病状を正しく診断するのに単一の画像で十分なことはめったにありません。代わりに、患者の病歴や検査結果などの追加の背景情報を考慮する必要があることがよくあります。したがって、エンドツーエンドの方法で不確実な最終診断を提供する解釈不能なブラックボックスシステムに焦点を当てる代わりに、異常のない画像で訓練された教師なしの方法を使用して医師が手のX線画像を評価するのに役立つ方法を調査します。この方法により、診断の効率が向上し、重要な領域が欠落するリスクが減少します。したがって、教師なし学習に最先端のアプローチを採用して異常を検出し、これらの方法の出力をどのように説明できるかを示します。異常の原因となることが多いノイズの影響を減らすために、強力な前処理パイプラインを導入します。さまざまなアプローチの広範な評価を提供し、ラベルがなくても手のX線画像の実世界のデータセットで満足のいく結果を達成できることを経験的に実証します。また、前処理の重要性を評価します。主な結果の1つは、前処理なしでは、ほとんどのアプローチがランダムよりも優れていることです。再現性を高め、研究を促進するために、https：//github.com/Valentyn1997/xrayでコードを公開します

A scale-dependent notion of effective dimension

有効寸法のスケール依存の概念

著者：Oksana Berezniuk, Alessio Figalli, Raffaele Ghigliazza, Kharen Musaelian
URL：http://arxiv.org/abs/2001.10872v1

この論文の概要（機械翻訳による和訳）
フィッシャー情報マトリックスをメトリックとして与えられたときにモデル空間をカバーするために必要なサイズ$ 1 / sqrt {n} $のキューブの数に基づく統計モデルの「有効な次元」の概念を導入します。。観測の数は、自然なスケールまたは解像度を修正します。次に、この自然なスケールを使用して正規化されたフィッシャー情報マトリックスのスペクトルを介して、有効な寸法が測定されます。

Variational Autoencoders for Opponent Modeling in Multi-Agent Systems

マルチエージェントシステムでの相手のモデリングのための変分オートエンコーダー

著者：Georgios Papoudakis, Stefano V. Albrecht
URL：http://arxiv.org/abs/2001.10829v1

この論文の概要（機械翻訳による和訳）
マルチエージェントシステムは、共有環境で複数のエージェントの相互作用から生じる複雑な動作を示します。この作業では、マルチエージェントシステムで1つのエージェントを制御することに興味があり、ポリシーが修正されている他のエージェントと対話することに成功します。システム内のエージェントの相互作用を理解するには、他のエージェント（相手）の動作をモデリングすることが不可欠です。教師なし学習での最近の進歩を活用することにより、バリエーションオートエンコーダーを使用して敵をモデル化することを提案します。さらに、文献の多くの既存の方法は、対戦相手のモデルがトレーニングと実行の両方の間に対戦相手の観察と行動にアクセスできると仮定しています。この仮定を排除するために、観察、行動、報酬などのエージェントのローカル情報のみを使用して、基礎となる敵モデルを特定しようとする修正を提案します。実験は、私たちの対戦相手のモデリング手法が、別のモデリング手法に対する強化学習タスクで同等以上のエピソードリターンを達成することを示しています。

Convergence Guarantees for Gaussian Process Approximations Under Several Observation Models

いくつかの観測モデルの下でのガウス過程近似のための収束保証

著者：George Wynne, François-Xavier Briol, Mark Girolami
URL：http://arxiv.org/abs/2001.10818v1

この論文の概要（機械翻訳による和訳）
ガウス過程は、統計分析、機械学習、応用数学のいたるところにあります。これらは、関数を近似するための柔軟なモデリングフレームワークを提供すると同時に、このタスクに関する不確実性を計算上扱いやすい方法で定量化します。重要な問題は、これらの近似が正確であるかどうか、もしそうであればどれだけ正確であるか、さまざまなモデリングの選択と問題の難しさです。答えは特定のアプリケーションのモデルとサンプリング分布の選択を知らせるため、これは実用的な関連性です。本論文では、Mat ‘ern andWendland共分散関数などの有限な平滑性を持つ共分散関数に基づくガウスプロセスモデルの新しい近似保証を提供します。それらは、データを収集するために使用される設計の特性に関して、Sobolevnormsの上限を取得する体系的なアプローチを促進するサンプリングの不等式から導き出されます。このアプローチにより、誤って指定された滑らかさの設定に適用され、ハイパーパラメーターの適応選択を可能にするいくつかの既存の結果を絞り込むことができますが、この論文の主な新規性は、補間、決定論的破損による回帰、回帰を含む幅広い観測モデルをカバーすることですガウスノイズ。

Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning

表形式強化学習のための漸近的に効率的なオフポリシー評価

著者：Ming Yin, Yu-Xiang Wang
URL：http://arxiv.org/abs/2001.10742v1

この論文の概要（機械翻訳による和訳）
強化学習のポリシー外評価の問題を検討します。目標は、ロギングポリシー$ mu $を実行して収集されたオフラインデータを使用して、ターゲットポリシー$ pi $の予想報酬を推定することです。この問題に対する標準的な重要度サンプリングベースのアプローチは、時間範囲$ H $で指数関数的にスケーリングする分散の影響を受けます。。特に、有限な状態と潜在的に無限のアクション。ただし、MSEの境界は、Cramer-Raoの下限$ Omega（H ^ 2 / n）$からまだ$ H $の係数です。この論文では、MIS推定量を単純に修正することで、アクション空間が有限であれば、Cramer-Raolower境界に漸近的に到達できることを証明します。また、高確率のエラー境界を持つMIS推定器を構築するための一般的な方法も提供します。

Extreme Algorithm Selection With Dyadic Feature Representation

二項特徴表現による極端なアルゴリズム選択

著者：Alexander Tornede, Marcel Wever, Eyke Hüllermeier
URL：http://arxiv.org/abs/2001.10741v1

この論文の概要（機械翻訳による和訳）
アルゴリズム選択（AS）は、アルゴリズム問題の特定のインスタンスに最も適した、固定された候補アルゴリズムのセットからアルゴリズムを選択すること、たとえば、SAT問題のソルバーを選択することを扱います。 ASのベンチマークスイートは通常、最大で数十個のアルゴリズムで構成される候補セットで構成されますが、アルゴリズムの選択とハイパーパラメーターの最適化の組み合わせでは、候補の数が手に負えなくなるため、効果的なメタモデルの学習が妨げられるため、コストのかかるオンラインパフォーマンス評価が必要になります。極端なアルゴリズム選択（XAS）の設定。ここでは、メタ学習を促進する数千の候補アルゴリズムの固定セットを検討します。 XAS設定への最先端のAS技術の適用性を評価し、問題のインスタンスとアルゴリズムの両方が記述されているダイアディック機能表現を活用するアプローチを提案します。後者は、現在の最先端の不変メトリックスを大幅に改善するものです。

FOCUS: Dealing with Label Quality Disparity in Federated Learning

焦点：連合学習におけるラベル品質の不均衡への対処

著者：Yiqiang Chen, Xiaodong Yang, Xin Qin, Han Yu, Biao Chen, Zhiqi Shen
URL：http://arxiv.org/abs/2001.11359v1

この論文の概要（機械翻訳による和訳）
End-Edge-Cloudアーキテクチャを備えたユビキタスシステムは、医療アプリケーションでますます使用されています。 Federated Learning（FL）は、サイロ効果とプライバシー保護のため、このようなアプリケーションに非常に役立ちます。既存のFLapproachesは、一般にlocaldataラベルの品質の不一致を考慮していません。しかし、ユビキタスシステムのクライアントは、さまざまなスキルレベル、バイアス、またはアノテーターの悪意のある改ざんによるラベルノイズに悩まされる傾向があります。この論文では、ユビキタスシステムのための連合日和見コンピューティング（FOCUS）を提案して、この課題に対処します。 FLサーバー上のベンチマークサンプルの小さなセットを維持し、ローカルデータセット上のFLモデルのパフォーマンスとベンチマークデータセット上のクライアントローカルFLモデルのパフォーマンス間の相互クロスエントロピーを計算することにより、クライアントローカルデータの信頼性を直接観察せずに定量化します。その後、信用加重オーケストレーションが実行され、FLモデルで信頼性の値に基づいてクライアントに割り当てられた重みが調整されます。 FOCUSは、合成データと実世界のデータの両方で実験的に評価されています。結果は、ノイズの多いラベルでクライアントを効果的に識別し、モデルのパフォーマンスへの影響を減らし、それによって既存のFLapproachesを大幅に上回ることを示しています。

Constructing Deep Neural Networks with a Priori Knowledge of Wireless Tasks

ワイヤレスタスクのアプリオリ知識を使用したディープニューラルネットワークの構築

著者：Jia Guo, Chenyang Yang
URL：http://arxiv.org/abs/2001.11355v1

この論文の概要（機械翻訳による和訳）
ディープニューラルネットワーク（DNN）は、トランシーバーの設計、リソースの最適化、情報の予測など、多くの側面でワイヤレスシステムの設計に採用されています。既存の作品は、完全に接続されたDNNまたは他のドメインで開発された特定のアーキテクチャを持つDNNを使用します。教師あり学習用のラベルを生成し、トレーニングサンプルを収集するのは時間や費用がかかりますが、トレーニングの複雑さを軽減するためのワイヤレス事前設定を使用したDNNの開発方法は未解決のままです。この論文では、ワイヤレスタスクに広く存在する2種類の順列不変特性を利用して、モデルパラメーターの数を減らし、したがってトレーニングのサンプルと計算の複雑さを減らすことができることを示します。入出力関係が置換順不変DNN（PINN）と呼ばれるプロパティを満たすDNNの特別なアーキテクチャを見つけ、プロパティでデータを拡張します。ワイヤレスシステムの規模の影響を学習することにより、構築されたPINNのサイズを入力データの次元に柔軟に適合させることができます。予測的リソース割り当てと干渉調整を例として取り上げ、PINNを使用して、監視なしおよび監視付き学習で最適なポリシーを学習する方法を示します。シミュレーション結果は、トレーニングの複雑さを軽減するという提案されたPINNsinの用語の劇的な利得を示しています。

Bayesian Neural Architecture Search using A Training-Free Performance Metric

トレーニング不要のパフォーマンスメトリックを使用したベイジアンニューラルアーキテクチャ検索

著者：Andrés Camero, Hao Wang, Enrique Alba, Thomas Bäck
URL：http://arxiv.org/abs/2001.10726v1

この論文の概要（機械翻訳による和訳）
リカレントニューラルネットワーク（RNN）は、時系列予測の強力なアプローチです。ただし、それらのパフォーマンスは、アーキテクチャとハイパーパラメータの設定に大きく影響されます。 RNNsisのアーキテクチャ最適化は時間のかかるタスクであり、検索スペースは通常、実数値、整数値、およびカテゴリ値の混合です。ネットワークのサイズを縮小および拡大できるようにするために、アーキテクチャの表現はしばしば可変長を持ちます。この論文では、ベイジアン最適化（BO）アルゴリズムのバリアントを使用して、アーキテクチャ最適化の問題に取り組むことを提案します。候補アーキテクチャの評価時間を短縮するために、ネットワークパフォーマンスを推定するトレーニング不要の方法である平均絶対誤差ランダムサンプリング（MRS）がBOの目的関数として採用されています。また、可変長アーキテクチャ表現に対処するための3つの固定長エンコーディングスキームを提案します。その結果、RNNの正確かつ効率的な設計に関する新しい視点が得られ、3つの問題について検証しています。私たちの調査結果は、1）BOアルゴリズムは、提案されたエンコーディングスキームを使用してさまざまなネットワークアーキテクチャを探索し、適切に機能するアーキテクチャを設計することができ、2）MRSを使用することで、実際のトレーニング手順から得られたアーキテクチャと比較してパフォーマンスを損なうことなく、最適化時間が大幅に短縮されることを示しています。

The Tensor Brain: Semantic Decoding for Perception and Memory

テンソル脳：知覚と記憶のための意味解読

著者：Volker Tresp, Sahand Sharifzadeh, Dario Konopatzki, Yunpu Ma
URL：http://arxiv.org/abs/2001.11027v1

この論文の概要（機械翻訳による和訳）
ナレッジグラフとテンソルの数学モデルを使用して知覚と記憶を分析し、人間の心の対応する機能の洞察を獲得します。私たちの議論は、基本的な事実を表現するための textit {subject-predicate-object}（SPO）トリプルからなる命題文の概念に基づいています。 SPOセンテンスはほとんどの自然言語の基礎ですが、脳内コミュニケーションや議論と推論の能力だけでなく、明確な知覚と宣言的記憶にも重要な場合があります。 SPO文のセットは知識グラフとして記述でき、隣接テンソルに変換できます。テンソルモデルを導入します。ここで、概念はインデックスおよび関連する埋め込みとして二重表現を持ち、脳内の暗黙的および明示的な知覚と記憶の理解に不可欠であると考えられる2つの構成要素です。私たちは、知覚と記憶の生物学的実現が情報処理に制約を課していると主張します。特に、明示的な知覚と宣言的記憶には、単純な実現では、4つの層に基づくセマンティックデコーダーが必要であることを提案します。情報をブロードキャストするためのメモリレスの表現層、第4に、処理センターおよびデータバッファとしてのワーキングメモリ層。ベイジアン脳の解釈では、意味的記憶はトリプルステートメントの事前定義を定義します。私たちは、進化と開発中に、意味記憶、エピソード記憶、自然言語が、感覚情報のより深い理解を得るために、エージェントのプロセスの創発的特性として進化したことを提案します。具体的なモデルの実現を提示し、最新のパフォーマンスを実証するベンチマークデータで提案モデルのいくつかの側面を検証します。

Machine Learning in Thermodynamics: Prediction of Activity Coefficients by Matrix Completion

熱力学における機械学習：行列補完による活動係数の予測

著者：Fabian Jirasek, Rodrigo A. S. Alves, Julie Damay, Robert A. Vandermeulen, Robert Bamler, Michael Bortz, Stephan Mandt, Marius Kloft, Hans Hasse
URL：http://arxiv.org/abs/2001.10675v1

この論文の概要（機械翻訳による和訳）
液体混合物の非理想性の尺度である放射能係数は、化学および相平衡ならびに輸送プロセスのモデリングに関連する化学工学の重要な特性です。数千のバイナリ混合物に関する実験データが利用可能ですが、これまでに調査されていない多くの関連する混合物の活動係数を計算するための予測方法が必要です。本報告では、任意のバイナリ混合物の活動係数を予測するための確率的行列因子分解モデルを提案します。考慮されたコンポーネントの物理記述子は使用されませんでしたが、この方法は、はるかに少ないトレーニング労力で30年以上にわたって洗練されてきた最先端の方法よりも優れています。これにより、化学工学におけるモデリングとシミュレーションに革命を起こす可能性のある二元混合物の物理化学的特性を予測するための新しい方法の展望が開かれます。

The Indian Chefs Process

インド人シェフのプロセス

著者：Patrick Dallaire, Luca Ambrogioni, Ludovic Trottier, Umut Güçlü, Max Hinne, Philippe Giguère, Brahim Chaib-Draa, Marcel van Gerven, Francois Laviolette
URL：http://arxiv.org/abs/2001.10657v1

この論文の概要（機械翻訳による和訳）
この論文では、Indian Chefs Process（ICP）を紹介します。これは、Infinite Buffet Processesを一般化する無限有向非巡回グラフ（DAG）と順序の結合空間に関するベイジアンノンパラメトリックです。構造が示すように、提案された分布は、ノードの順序と発信接続確率の両方を制御する潜在ベータプロセスに依存し、スパース無限グラフの確率分布を生成します。以前に提案されたDAG構造のベイジアンノンパラメトリック事前分布に対するICPの主な利点は、柔軟性が高いことです。私たちの知る限り、ICPはすべての可能なDAGをサポートするfirstBayesianノンパラメトリックモデルです。深い生成シグモイドネットワークと畳み込みニューラルネットワークの構造の学習に関するICPの有用性を示します。

Regularization Helps with Mitigating Poisoning Attacks: Distributionally-Robust Machine Learning Using the Wasserstein Distance

正則化は中毒攻撃の緩和に役立ちます：Wasserstein距離を使用した分布にロバストな機械学習

著者：Farhad Farokhi
URL：http://arxiv.org/abs/2001.10655v1

この論文の概要（機械翻訳による和訳）
機械学習に分散ロバスト最適化を使用して、データ汚染攻撃の影響を軽減します。 Wasserstein距離を使用して定義された経験的分布（中毒攻撃によって破損したトレーニングデータセットから抽出された）の近傍の最悪ケースの分布に対してモデルをトレーニングすることにより、元のデータ（毒レコードを含まない）のトレーニングモデルのパフォーマンス保証を提供します。正規化子としての経験的サンプル平均適合度と（特定のモデルパラメーターのデータ上の）適合関数のリプシッツ定数に基づいて、最悪の適合度の上限を見つけることにより、分布的に堅牢な機械学習問題を緩和します。回帰モデルの場合、thisregularizerがモデルパラメーターの双対ノルムに等しいことを証明します。本書の結果を実証するために、WineQualityデータセット、Boston Housing Marketデータセット、およびAdultデータセットを使用します。

Treatment effect estimation with disentangled latent factors

潜在因子を解きほぐした治療効果の推定

著者：Weijia Zhang, Lin Liu, Jiuyong Li
URL：http://arxiv.org/abs/2001.10652v1

この論文の概要（機械翻訳による和訳）
がん患者が直面する差し迫った懸念は、予後が不十分な治療選択肢であるということです。レシーバー放射線療法などの二元治療を考慮すると、問題は患者の生存転帰に対する放射線療法の治療効果の推定として特徴付けることができます。観察研究からの治療効果の推定は根本的な問題ですが、反事実的かつ複雑な問題。この作業では、治療または結果にのみ影響を与える要因と複雑な要因を区別することの重要性を示し、より正確な推定治療評価のために、潜在要因を学習して3つの互いに素なセットにもつれを解くためのデータ駆動型アプローチを提案します。半合成ベンチマークと実際のデータセットは、提案された方法の有効性を示しています。

Modelling and Quantifying Membership Information Leakage in Machine Learning

機械学習における会員情報漏洩のモデリングと定量化

著者：Farhad Farokhi, Mohamed Ali Kaafar
URL：http://arxiv.org/abs/2001.10648v1

この論文の概要（機械翻訳による和訳）
機械学習モデルは、メンバーシップ推論攻撃に対して脆弱であることが示されています。つまり、モデルのトレーニングに個人のデータが使用されているかどうかを推測します。これらの攻撃の成功に寄与する要因についての理解が不足しているため、情報理論を使用してメンバーシップ情報漏洩をモデル化し、メンバーシップ情報漏洩を減らすことができる機械学習モデルとトレーニングアルゴリズムの特性を調査する必要があります。条件付き相互情報漏えいを使用して、トレーニングデータセット内の個人の存在に関するトレーニング済み機械学習モデルからの情報漏えいの量を測定します。 Kullback-Leiblerダイバージェンスを使用して、情報漏洩のこの測定値の上限を考案しました。 Kullback–Leiblerメンバーシップ情報の漏洩と、特定のデータレコードが機械学習モデルのトレーニングデータセットに属しているかどうかを調べる仮説テストの敵の成功確率との直接的な関係を証明します。相互情報漏洩は、トレーニングデータセットのサイズと正則化の重みの減少関数であることを示します。また、機械学習モデルの感度（モデルパラメーターに対する適合度の導関数で定義される）が高い場合、より多くのメンバーシップ情報が漏れる可能性があることも証明します。これは、ディープニューラルネットワークなどの複雑なモデルは、自由度の少ない単純なモデルと比較して、メンバーシップ推論攻撃の影響を受けやすいことを示しています。 Gaussian $（を使用すると、会員情報の漏えい量が$ mathcal {O}（ log ^ {1/2}（ delta ^ {-1}） epsilon ^ {-1}）$減少することがわかります。 epsilon、 delta）$-微分的にプライベートな加法性ノイズ。

Binary Classification from Positive Data with Skewed Confidence

信頼度が歪んでいる正のデータからのバイナリ分類

著者：Kazuhiko Shinoda, Hirotaka Kaji, Masashi Sugiyama
URL：http://arxiv.org/abs/2001.10642v1

この論文の概要（機械翻訳による和訳）
Positive-confidence（Pconf）分類[Ishida et al。、2018]は、信頼性を備えたポジティブデータのみからバイナリ分類器をトレーニングする有望な弱教師付き学習方法です。ただし、実際には、注釈プロセスで生じるバイアスによって信頼性が歪む場合があります。 Pconfclassifierは、ゆがんだ信頼性で適切に学習できず、その結果、分類パフォーマンスが低下する可能性があります。本論文では、歪んだ信頼性のパラメータ化モデルを導入し、事前知識として正のサンプルの誤分類率があるという仮定の下で、歪んだ信頼性の負の影響を相殺するハイパーパラメータを選択する方法を提案します。単純な線形モデルを用いた合成実験およびニューラルネットワークモデルを用いたベンチマーク問題を通して、提案された方法の有効性を実証します。また、この方法をドライバーの眠気予測に適用して、手動注釈に基づいて信頼性が得られる現実の問題でうまく機能することを示します。