2024-01-01から1年間の記事一覧
隠れマルコフモデル 系列データに対して、次数をもつマルコフ性の仮定に制限されず、なおかつ自由パラメータの数が制限されたモデルを作ることを考える。これは潜在変数を導入することで、実現される。図のようにマルコフ連鎖を構成するのが潜在変数であると…
マルコフモデル 時系列${x_1, \ldots, x_n}$のような系列データを最も簡単に扱う方法は、系列であるという性質を無視してそれぞれ観測値が独立同分布に従うものとして扱うことである(下図)。しかし、この方法は、データの順序に関係するパターンを捉えるこ…
BitNet: Scaling 1-bit Transformers forLarge Language Models Hongyu Wang†‡ Shuming Ma† Li Dong† Shaohan Huang† Huaijie Wang§ Lingxiao Ma† Fan Yang† Ruiping Wang‡ Yi Wu§ Furu Wei†⋄† Microsoft Research ‡ University of Chinese Academy of Scien…
GPT Takes the Bar Exam Michael Bommarito II, Daniel Martin Katz 2022 arxiv.org ライセンス CC BY 4.0 Deed | Attribution 4.0 International | Creative Commons GPT Takes the Bar Exam Abstract Introduction 法律システムの複雑さについて 機械学習…
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits Shuming Ma∗ Hongyu Wang∗ Lingxiao Ma Lei Wang Wenhui WangShaohan Huang Li Dong Ruiping Wang Jilong Xue Furu Wei⋄ arxiv.org このページの図面・表の権利は全て論文の著者らに帰属…
Machine learning for seismic exploration: Where are we and how far are we from the holy grail? https://library.seg.org/doi/10.1190/geo2023-0129.1 Farbod Khosro Anjom1, Francesco Vaccarino2, and Laura Valentina Socco1 1DIATI, Politecnico di…
Masked Autoencoders Are Scalable Vision Learners arxiv.org Kaiming He, Xinlei Chen, Saining Xie, Yanghao Li, Piotr Dollár, Ross Girshick ライセンス: CC BY 4.0 Deed | Attribution 4.0 International | Creative Commons Abstract 目的:マスク付…
Using Deep Learning for Flexible and Scalable Earthquake Forecasting Kelian Dascher-Cousineau1,2, Oleksandr Shchur3, Emily E. Brodsky1, and Stephan Günnemann3 1Department of Earth and Planetary Sciences, University of California, Santa Cru…
Earthquake transformer—an attentive deep-learning model for simultaneous earthquake detection and phase picking www.nature.com S. Mostafa Mousavi, William L. Ellsworth, Weiqiang Zhu, Lindsay Y. Chuang & Gregory C. Beroza Published: 07 Augu…
論文要約:Phase Neural Operator for Multi-Station Picking of Seismic Arrivals https://agupubs.onlinelibrary.wiley.com/doi/full/10.1029/2023GL106434 ライセンス CC BY-NC 4.0 Deed | Attribution-NonCommercial 4.0 International | Creative Commo…
Dropout: A Simple Way to Prevent Neural Networks from Overfitting jmlr.org ライセンス CC BY 4.0 Deed | Attribution 4.0 International | Creative Commons 図表は元論文から引用 Abstract 目的: 過学習の問題を解決し、大規模ニューラルネットワーク…
PhaseNet: a deep-neural-network-based seismic arrival-time picking method Abstract 研究目的 地震モニタリングの基本である地震相の手動での選択が、地震センサーの増加に伴いますます困難になっている問題を解決するため、深層ニューラルネットワーク…
Going Deeper with Convolutions arxiv.org 図表は全て元論文から引用 Abstract 研究目的 新たな深層畳み込みニューラルネットワークアーキテクチャ「Inception」を提案し、ImageNet Large-Scale Visual Recognition Challenge 2014(ILSVRC14)における分類…
Deep Residual Learning for Image Recognition arxiv.org 図表は全て元論文から引用 Abstract 研究目的 より深いニューラルネットワークの訓練を容易にするための残差学習フレームワークを提案する。 方法 層を参照なしの関数学習ではなく、層の入力を参照…
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks arxiv.org 図表は全て元論文から引用 Abstract - 研究目的: 畳み込みニューラルネットワーク(ConvNets)のモデルスケーリングを体系的に研究し、ネットワークの深さ、幅、解像…
ImageNet Classification with Deep Convolutional Neural Networks https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton 図表はすべてKrizhevsk…