経済学部 経済学科
人工知能科学研究科 人工知能科学専攻 博士課程後期課程
確率モデル
テキストマイニング
機械学習
データマイニング
-
2022年4月 - 現在人工知能科学研究科 人工知能科学専攻 博士課程前期課程 教授
-
2022年4月 - 現在人工知能科学研究科 人工知能科学専攻 博士課程後期課程 教授
-
2020年4月 - 現在経済学部 経済学科 教授
-
2020年4月 - 2022年3月人工知能科学研究科 人工知能科学専攻修士課程 教授
研究者詳細
2024/10/07 更新
確率モデル
テキストマイニング
機械学習
データマイニング
情報通信 / 情報学基礎論
情報通信 / 知能情報学
情報通信 / データベース
国名:日本国
国名: 日本国
国名: 日本国
国名: 日本国
国名: 日本国
受賞国:日本国
受賞国:日本国
Feature Extraction from Equipment Sensor Signals with Time Series Clustering and Its Application to Defect Prediction
Daisuke Hamaguchi, Tomonari Masada, Takumi Eguchi
IEEE International Symposium on Semiconductor Manufacturing Conference Proceedings2020- 2020年12月15日
Myanmar Text-to-Speech System based on Tacotron-2.
Yuzana Win, Tomonari Masada
International Conference on Information and Communication Technology Convergence(ICTC) 578 - 583 2020年
Myanmar Text-to-Speech System based on Tacotron (End-to-End Generative Model).
Yuzana Win, Htoo Pyae Lwin, Tomonari Masada
International Conference on Information and Communication Technology Convergence(ICTC) 572 - 577 2020年
Context-Dependent Token-Wise Variational Autoencoder for Topic Modeling. 査読有り
Tomonari Masada
Current Trends in Web Engineering - ICWE 2019 International Workshops 35 - 47 2019年
Difference between Similars: A Novel Method to Use Topic Models for Sensor Data Analysis. 査読有り
Tomonari Masada, Takumi Eguchi, Daisuke Hamaguchi
2019 International Conference on Data Mining Workshops 391 - 398 2019年
Mini-Batch Variational Inference for Time-Aware Topic Modeling. 査読有り
Tomonari Masada, Atsuhiro Takasu
PRICAI 2018: Trends in Artificial Intelligence - 15th Pacific Rim International Conference on Artificial Intelligence, Nanjing, China, August 28-31, 2018, Proceedings, Part II 156 - 164 2018年
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka Composition 査読有り
Tomonari Masada, Atsuhiro Takasu
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)10862 395 - 402 2018年
Document Modeling with Implicit Approximate Posterior Distributions. 査読有り
Tomonari Masada
Proceedings of the International Conference on Data Processing and Applications, ICDPA 2018, Guangdong, China, May 12-14, 2018 45 - 48 2018年
Adversarial Learning for Topic Models. 査読有り
Tomonari Masada, Atsuhiro Takasu
Advanced Data Mining and Applications - 14th International Conference, ADMA 2018, Nanjing, China, November 16-18, 2018, Proceedings 292 - 302 2018年
Estimating Word probabilities with neural networks in latent dirichlet allocation 査読有り
Tomonari Masada
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)10526 129 - 137 2017年
Exploring OOV Words from Myanmar Text Using Maximal Substrings 査読有り
Yuzana Win, Tomonari Masada
PROCEEDINGS 2016 5TH IIAI INTERNATIONAL CONGRESS ON ADVANCED APPLIED INFORMATICS IIAI-AAI 2016 657 - 663 2016年
Extraction of Proper Names from Myanmar Text Using Latent Dirichlet Allocation 査読有り
Yuzana Win, Tomonari Masada
2016 CONFERENCE ON TECHNOLOGIES AND APPLICATIONS OF ARTIFICIAL INTELLIGENCE (TAAI) 96 - 103 2016年
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation 査読有り
Tomonari Masada, Atsuhiro Takasu
COMPUTATIONAL SCIENCE AND ITS APPLICATIONS - ICCSA 2016, PT IV9789 232 - 245 2016年
A simple stochastic gradient variational bayes for the correlated topic model 査読有り
Tomonari Masada, Atsuhiro Takasu
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)9932 424 - 428 2016年
Heuristic Pretraining for Topic Models 査読有り
Tomonari Masada, Atsuhiro Takasu
CURRENT APPROACHES IN APPLIED ARTIFICIAL INTELLIGENCE9101 351 - 360 2015年
Traffic Speed Data Investigation with Hierarchical Modeling 査読有り
Tomonari Masada, Atsuhiro Takasu
FUTURE DATA AND SECURITY ENGINEERING, FDSE 20159446 123 - 134 2015年
Exploring Technical Phrase Frames from Research Paper Titles 査読有り
Yuzana Win, Tomonari Masada
2015 IEEE 29TH INTERNATIONAL CONFERENCE ON ADVANCED INFORMATION NETWORKING AND APPLICATIONS WORKSHOPS WAINA 2015 558 - 563 2015年
ChronoSAGE: Diversifying Topic Modeling Chronologically 査読有り
Tomonari Masada, Atsuhiro Takasu
WEB-AGE INFORMATION MANAGEMENT, WAIM 20148485 476 - 479 2014年
A topic model for traffic speed data analysis 査読有り
Tomonari Masada, Atsuhiro Takasu
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)8482 ( 2 ) 68 - 77 2014年
Explaining Prices by Linking Data: A Pilot Study on Spatial Regression Analysis of Apartment Rents 査読有り
Bin Shen, Tomonari Masada
2014 IEEE 3RD GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE) 188 - 189 2014年
Collaborator Recommendation for Isolated Researchers 査読有り
Tin Huynh, Atsuhiro Takasu, Tomonari Masada, Kiem Hoang
2014 28TH INTERNATIONAL CONFERENCE ON ADVANCED INFORMATION NETWORKING AND APPLICATIONS WORKSHOPS (WAINA) 639 - 644 2014年
Trimming prototypes of handwritten digit images with subset infinite relational model 査読有り
Tomonari Masada, Atsuhiro Takasu
Lecture Notes in Electrical Engineering240 129 - 134 2013年
A revised inference for correlated topic model 査読有り
Tomonari Masada, Atsuhiro Takasu
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)7952 ( 2 ) 445 - 454 2013年
Three-way nonparametric Bayesian clustering for handwritten digit image classification 査読有り
Tomonari Masada, Atsuhiro Takasu
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)8228 ( 3 ) 149 - 156 2013年
Clustering Documents with Maximal Substrings 査読有り
Tomonari Masada, Atsuhiro Takasu, Yuichiro Shibata, Kiyoshi Oguri
ENTERPRISE INFORMATION SYSTEMS, ICEIS 2011102 19 - 34 2012年
Extraction of topic evolutions from references in scientific articles and its GPU acceleration 査読有り
Tomonari Masada, Atsuhiro Takasu
ACM International Conference Proceeding Series 1522 - 1526 2012年
Unsupervised segmentation of bibliographic elements with latent permutations 査読有り
Tomonari Masada, Yuichiro Shibata, Kiyoshi Oguri
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)6724 LNCS 254 - 267 2011年
Tomonari Masada, Atsuhiro Takasu, Yuichiro Shibata, Kiyoshi Oguri
ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PT I6634 435 - 447 2011年
DOCUMENTS AS A BAG OF MAXIMAL SUBSTRINGS An Unsupervised Feature Extraction for Document Clustering 査読有り
Tomonari Masada, Yuichiro Shibata, Kiyoshi Oguri
ICEIS 2011: PROCEEDINGS OF THE 13TH INTERNATIONAL CONFERENCE ON ENTERPRISE INFORMATION SYSTEMS, VOL 1 5 - 13 2011年
Semi-supervised Bibliographic Element Segmentation with Latent Permutations 査読有り
Tomonari Masada, Atsuhiro Takasu, Yuichiro Shibata, Kiyoshi Oguri
DIGITAL LIBRARIES: FOR CULTURAL HERITAGE, KNOWLEDGE DISSEMINATION, AND FUTURE CREATION7008 60 - + 2011年
Implementation of a programming environment with a multithread model for reconfigurable systems 査読有り
Keisuke Dohi, Yuichiro Shibata, Tsuyoshi Hamada, Tomonari Masada, Kiyoshi Oguri, Duncan A. Buell
ACM SIGARCH Computer Architecture News38 ( 4 ) 40 - 45 2010年9月14日
Infinite Latent Process Decomposition 査読有り
Tomonari Masada, Yuichiro Shibata, Kiyoshi Oguri
2010 IEEE INTERNATIONAL CONFERENCE ON BIOINFORMATICS AND BIOMEDICINE WORKSHOPS (BIBMW) 810 - 811 2010年
Modeling Topical Trends over Continuous Time with Priors 査読有り
Tomonari Masada, Daiji Fukagawa, Atsuhiro Takasu, Yuichiro Shibata, Kiyoshi Oguri
ADVANCES IN NEURAL NETWORKS - ISNN 2010, PT 2, PROCEEDINGS6064 302 - + 2010年
Tsuyoshi Hamada, Keigo Nitadori, Khaled Benkrid, Yousuke Ohno, Gentaro Morimoto, Tomonari Masada, Yuichiro Shibata, Kiyoshi Oguri, Makoto Taiji
Computer Science - Research and Development24 ( 1-2 ) 21 - 31 2009年9月
GPUを用いた位相限定相関法の高速化(ITS画像処理,映像メディア及び一般) 査読有り
松尾 堅太郎, 三好 正之, 濱田 剛, 柴田 裕一郎, 正田 備也, 小栗 清
映像情報メディア学会技術報告33 ( 0 ) 201 - 206 2009年
Bag of Timestamps: A Simple and Efficient Bayesian Chronological Mining 査読有り
Tomonari Masada, Atsuhiro Takasu, Tsuyoshi Hamada, Yuichiro Shibata, Kiyoshi Oguri
ADVANCES IN DATA AND WEB MANAGEMENT, PROCEEDINGS5446 556 - + 2009年
Tomonari Masada, Tsuyoshi Hamada, Yuichiro Shibata, Kiyoshi Oguri
NEXT-GENERATION APPLIED INTELLIGENCE, PROCEEDINGS5579 491 - 500 2009年
Dynamic hyperparameter optimization for bayesian topical trend analysis 査読有り
Tomonari Masada, Daiji Fukagawa, Atsuhiro Takasu, Tsuyoshi Hamada, Yuichiro Shibata, Kiyoshi Oguri
International Conference on Information and Knowledge Management, Proceedings 1831 - 1834 2009年
Bayesian Multi-topic Microarray Analysis with Hyperparameter Reestimation 査読有り
Tomonari Masada, Tsuyoshi Hamada, Yuichiro Shibata, Kiyoshi Oguri
ADVANCED DATA MINING AND APPLICATIONS, PROCEEDINGS5678 253 - 264 2009年
LDA文書モデルによる画像からの多重トピック抽出のGPUを用いた高速化(高精細度画像の処理・表示および一般) 査読有り
正田 備也, 濱田 剛, 柴田 裕一郎, 小栗 清
映像情報メディア学会技術報告32 ( 0 ) 1 - 6 2008年
GPUを用いたサブペタペタフロップス高性能計算機システム(高精細度画像の処理・表示および一般) 査読有り
濱田 剛, 正田 備也, 柴田 裕一郎, 小栗 清
映像情報メディア学会技術報告32 ( 0 ) 17 - 19 2008年
Unmixed spectrum clustering for template composition in lung sound classification 査読有り
Tomonari Masada, Senya Kiyasu, Sueharu Miyahara
ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PROCEEDINGS5012 964 - 969 2008年
Comparing LDA with pLSI as a dimensionality reduction method in document clustering 査読有り
Tomonari Masada, Senya Kiyasu, Sueharu Miyahara
LARGE-SCALE KNOWLEDGE RESOURCES4938 13 - 26 2008年
P2P情報検索における単語の重みに基づいたデータ分散配置手法(共著)
倉沢央, 若木宏美, 正田備也, 高須淳宏, 安達淳
情報処理学会 マルチメディア、分散、協調とモバイルシンポジウム(DICOMO2007) 2007年7月
混合ディリクレ分布を用いた文書分類の精度について(共著) 査読有り
正田備也, 高須淳宏, 安達淳
情報処理学会論文誌: データベース48 ( SIG11(TOD34) ) 14 - 26 2007年6月15日
P2P情報検索における索引とファイルの分散配置手法
倉沢央, 正田備也, 高須淳宏, 安達淳
情報処理学会研究報告2007 ( 36 ) 147 - 154 2007年4月5日
トピック指向単語クラスタリングを用いた複数トピックの包括的提示による検索支援
若木裕美, 正田備也, 高須淳宏, 安達淳
電子情報通信学会第18回データ工学ワークショップ (DEWS 2007) 2007年3月
Detection of abnormal lung sounds through investigation of breathing cycle 査読有り
Senya Kiyasu, Kohsuke Yanagihara, Tomonari Masada, Sueharu Miyahara, Mikio Oka
Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers61 ( 12 ) 1769 - 1773 2007年
Using a Knowledge Base to Disambiguate Personal Name in Web Search Results 査読有り
Quang Minh Vu, Tomonari Masada, Atsuhiro Takasu, Jun Adachi
APPLIED COMPUTING 2007, VOL 1 AND 2 839 - + 2007年
Disambiguation of people in web search using a knowledge base 査読有り
Quang Minh Vu, Tomonari Masada, Atsuhiro Takasu, Jun Adachi
2007 IEEE International Conference on Research, Innovation and Vision for the Future, RIVF 2007 185 - 191 2007年
Query Refinement based on Topical Term Clustering. 査読有り
Hiromi Wakaki, Tomonari Masada, Atsuhiro Takasu, Jun Adachi
Computer-Assisted Information Retrieval (Recherche d'Information et ses Applications) - RIAO 2007, 8th International Conference, Carnegie Mellon University, Pittsburgh, PA, USA, May 30 - June 1, 2007. Proceedings, CD-ROM 2007年
Citation data clustering for author name disambiguation. 査読有り
Tomonari Masada, Atsuhiro Takasu, Jun Adachi
Proceedings of the 2nf International Conference on Scalable Information Systems, Infoscale 2007, Suzhou, China, June 6-8, 2007 62 2007年
Using web directories for similarity measurement in personal name disambiguation 査読有り
Quang Minh Vu, Atsuhiro Takasu, Tomonari Masada, Jun Adachi
Proceedings - 21st International Conference on Advanced Information Networking and Applications Workshops/Symposia, AINAW'072 379 - 384 2007年
具体性指向単語クラスタリングによる網羅的トピックの発見と検索 質問拡張支援
若木裕美, 正田備也, 高須淳宏, 安達淳
電子情報通信学会第17回データ工学ワークショップ (DEWS 2006), 2C-i4 2006年3月
A new measure for query disambiguation using term co-occurrences 査読有り
Hiromi Wakaki, Tomonari Masada, Atsuhiro Takasu, Jun Adachi
INTELLIGENT DATA ENGINEERING AND AUTOMATED LEARNING - IDEAL 2006, PROCEEDINGS4224 904 - 911 2006年
Link-Based Clustering for Finding Subrelevant Web Pages 査読有り
Tomonari Masada, Atsuhiro Takasu, Jun Adach i
Proc. International Workshop on Web Document Analysis, 2005 (WDA2005) 2005年9月
検索語の曖昧性を解消するキーワードの提示手法
若木裕美, 正田備也, 高須淳宏, 安達淳
情報処理学会研究報告「データベースシステム」137 ( 137 ) 269 - 276 2005年7月
共著関係に基づくグラフを用いた書誌 情報における著者同定手法の提案と評価
鈴木康平, 正田備也, 高須淳宏, 安達淳
情報処理学会研究報告「データベースシ ステム」(夏のデータベースワークショップDBWS2005), 2005. ( 137 ) 2005年7月
Improving Web Search by Query Expansion with a Small Number of Terms. 査読有り
Tomonari Masada, Teruhito Kanazawa, Atsuhiro Takasu, Jun Adachi
Proceedings of the Fifth NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-5, National Center of Sciences, Tokyo, Japan, December 6-9, 2005 2005年
Decomposing the Web graph into parameterized connected components 査読有り
T Masada, A Takasu, J Adachi
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMSE87D ( 2 ) 380 - 388 2004年2月
R2D2 at NTCIR-4 Web Retrieval Task. 査読有り
Teruhito Kanazawa, Tomonari Masada, Atsuhiro Takasu, Jun Adachi
Proceedings of the Fourth NTCIR Workshop on Research in Information Access Technologies Information Retrieval, Question Answering and Summarization, NTCIR-4, National Center of Sciences, Tokyo, Japan, June 2-4, 2004 2004年
Web page grouping based on parameterized connectivity 査読有り
T Masada, A Takasu, J Adachi
DATABASE SYSTEMS FOR ADVANCED APPLICATIONS2973 374 - 380 2004年
パラメータ化された連結成分分解を用いたWeb情報の有効利用
正田備也, 高須淳宏, 安達淳
情報処理学会研究報告「データベースシステム」 (夏のデータベースワークショップDBWS2003), 2003. ( 131(71 ) 2003年7月22日
パラメータ化された連結成分分解によるWebページのグループ化
正田備也, 高須淳宏, 安達淳
情報処理学会データベースシステム研究会、情処研報2002 ( 67, DB ) 297 - 304 2002年7月
A Package for Triangulations. 査読有り
Tsuyoshi Ono, Yoshiaki Kyoda, Tomonari Masada, Kazuyoshi Hayase, Tetsuo Shibuya, Motoki Nakade, Mary Inaba, Hiroshi Imai, Keiko Imai, David Avis
Proceedings of the Twelfth Annual Symposium on Computational Geometry, Philadelphia, PA, USA, May 24-26, 1996 V-17-V-18 - 17 1996年
Enumeration of Regular Triangulations. 査読有り
Tomonari Masada, Hiroshi Imai, Keiko Imai
Proceedings of the Twelfth Annual Symposium on Computational Geometry, Philadelphia, PA, USA, May 24-26, 1996 224 - 233 1996年
近藤 伸郎, 正田 備也
じんもんこん2020論文集 ( 2020 ) 297 - 302 2020年12月5日
丹羽 量久, 正田 備也, 福澤 勝彦, 三根 眞理子, 山地 弘起
長崎大学大学教育イノベーションセンター紀要 = Journal of the Center for Educational Innovation, Nagasaki University5 ( 5 ) 19 - 24 2014年3月
Unsupervised Segmentation of Bibliographic Elements with Latent Permutations
Tomonari Masada
International Journal of Organizational and Collective Intelligence2 ( 2 ) 49 - 62 2011年
リコンフィギャラブルマシンにおけるDMA転送とデータ配置の自動最適化手法の検討
志田 さや香, 土肥 慶亮, 柴田 裕一郎, 濱田 剛, 正田 備也, 小栗 清
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition)92 ( 12 ) 2127 - 2136 2009年12月1日
荒木 裕太, 柴田 裕一郎, 濱田 剛, 正田 備也, 小栗 清
電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム : IEICE technical report109 ( 320 ) 19 - 24 2009年11月26日
副島 政人, 酒見 隼也, 柴田 裕一郎, 黒川 不二雄, 濱田 剛, 正田 備也, 小栗 清
電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム : IEICE technical report109 ( 198 ) 19 - 24 2009年9月10日
リコンフィギャラブルシステムにおけるマルチスレッドプログラミングモデルを用いたメモリアクセス最適化手法の一検討
土肥 慶亮, 志田 さや香, 柴田 裕一郎, 濱田 剛, 正田 備也, 小栗 清
電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム : IEICE technical report109 ( 26 ) 61 - 66 2009年5月7日
濱田 剛, 正田 備也, 柴田 裕一郎, 小栗 清
電子情報通信学会技術研究報告. IE, 画像工学108 ( 324 ) 17 - 19 2008年11月21日
LDA文書モデルによる画像からの多重トピック抽出のGPUを用いた高速化
正田 備也, 濱田 剛, 柴田 裕一郎, 小栗 清
電子情報通信学会技術研究報告. IE, 画像工学108 ( 324 ) 1 - 6 2008年11月21日
文書クラスタリングのための潜在的ディリクレ配分法による次元圧縮
正田備也, 喜安 千弥, 宮原 末治
情報処理学会研究報告データベースシステム(DBS)2007 ( 65 ) 381 - 386 2007年7月3日
文書クラスタリングのための潜在的ディリクレ配分法による次元圧縮
正田 備也, 喜安 千弥, 宮原 末治
電子情報通信学会技術研究報告. DE, データ工学107 ( 131 ) 381 - 386 2007年7月2日
Personal Name Disambiguation in Web Search Using Knowledge Base (jointly worked)
Quang Minh VU, Tomonari MASADA, Atsuhiro TAKASU, Jun ADACHI
DBSJ Letters5 ( 4 ) 53 - 56 2007年
VuQuangMinh, 正田備也, 高須 淳宏, 安達 淳
情報処理学会研究報告データベースシステム(DBS)2006 ( 78 ) 185 - 192 2006年7月13日
ヴー クァン ミン, 正田 備也, 高須 淳宏, 安達 淳
電子情報通信学会技術研究報告. DE, データ工学106 ( 149 ) 143 - 148 2006年7月6日
検索語の曖昧性解消のためのトピック指向単語抽出および単語クラスタリング
若木裕美, 正田備也, 高須淳宏, 安達淳
情報処理学会論文誌(トランザクション)データベース47 ( SIG19 ) 72 - 85 2006年
Topic-oriented Term Extraction and Term Clustering for Query Focusing
Hiromi WAKAKI, Tomonari MASADA, Atsuhiro TAKASU, Jun ADACHI
IPSJ Transactions on Databases47 ( SIG19 ) 72 - 85 2006年
若木 裕美, 正田 備也, 高須 淳宏, 安達 淳
電子情報通信学会技術研究報告. DE, データ工学105 ( 172 ) 1 - 6 2005年7月7日
リンク情報の利用によるWeb検索性能の改善
正田備也, 高須淳宏, 安達淳
情報処理学会論文誌(トランザクション)データベース46 ( SIG8 ) 48 - 59 2005年
Improving Web Search Performance with Hyperlink Information
Tomonari MASADA, Atsuhiro TAKASU, Jun ADACHI
IPSJ Transactions on Databases46 ( SIG8 ) 48 - 59 2005年
Decomposing the Web Graph into Parameterized Connected Components
MASADA Tomonari, TAKASU Atsuhiro, ADACHI Jun
IEICE transactions on information and systems87 ( 2 ) 380 - 388 2004年2月1日
正田備也, 高須淳宏, 安達淳
DBSJ Letters2 ( 1 ) 3 - 6 2003年
A New Notion of Connectivity and its Application to Web Page Grouping
Tomonari MASADA, Atsuhiro TAKASU, Jun ADACHI
2 ( 1 ) 3 - 6 2003年
Enumerating triangulations in general dimensions
H Imai, T Masada, F Takeuchi, K Imai
INTERNATIONAL JOURNAL OF COMPUTATIONAL GEOMETRY & APPLICATIONS12 ( 6 ) 455 - 480 2002年12月
パラメータ化された連結成分分解による Web ページのグループ化
正田 備也, 高須 淳宏, 安達 淳
電子情報通信学会技術研究報告. DE, データ工学102 ( 208 ) 137 - 142 2002年7月11日
正田備也, 高須淳宏, 安達淳
DBSJ Letters1 ( 1 ) 47 - 50 2002年
Grouping Web Pages Based on Parameterized Connectivity
Tomonari MASADA, Atsuhiro TAKASU, Jun ADACHI
1 ( 1 ) 47 - 50 2002年
Documents as a Bag of Maximal Substrings: An Unsupervised Feature Extraction for Document Clustering
13th International Conference on Enterprise Information Systems (ICEIS 2011) 2011年
Semi-supervised Bibliographic Element Segmentation with Latent Permutations
International Conference on Asia-Pacific Digital Libraries (ICADL 2011) 2011年
Infinite Latent Process Decomposition
IEEE International Conference on Bioinformatics & Biomedicine (BIBM 2010) 2010年
Unsupervised Segmentation of Bibliographic Elements with Latent Permutations
The 1st International Workshop on Web Intelligent Systems and Services (WISS 2010) 2010年
시간에 따른 의미 변화 인지를 위한 가중치 구조의 적용
2010 IEEK Summer Conference 2010年
Modeling Topical Trends over Continuous Time with Priors
the seventh International Symposium on Neural Networks (ISNN 2010) 2010年
An Adaptive Weighting Scheme for Time-dependent Semantic Change Recognition
2010年
Accelerating Collapsed Variational Bayesian Inference for Latent Dirichlet Allocation with Nvidia CUDA compatible devices
IEA/AIE 2009 2009年
Bag of Timestamps: A Simple and Efficient Bayesian Chronological Mining
Proc. of the Joint Conference on Asia-Pacific Web Conference (APWeb) and Web-Age Information Management (WAIM) 2009年
Bayesian Multi-topic Microarray Analysis with Hyperparameter Reestimation
ADMA 2009 2009年
Dynamic Hyperparameter Optimization for Bayesian Topical Trend Analysis
CIKM 2009 2009年
Accelerating Collapsed Variational Bayesian Inference for Latent Dirichlet Allocation with Nvidia CUDA compatible devices
2009年
Bag of Timestamps: A Simple and Efficient Bayesian Chronological Mining
2009年
Bayesian Multi-topic Microarray Analysis with Hyperparameter Reestimation
2009年
Dynamic Hyperparameter Optimization for Bayesian Topical Trend Analysis
2009年
Character Categorization via Latent Dirichlet Allocation for Kana Sequence Segmentation with Conditional Random Fields
16th International Conference on Computers in Education (ICCE 2008) 2008年
Unmixed Spectrum Clustering for Template Composition in Lung Sound Classification
Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) 2008 2008年
Comparing LDA with pLSI as a Dimensionality Reduction Method in Document Clustering.
3rd International Conference on Large-scale Knowledge Resources 2008年
Character Categorization via Latent Dirichlet Allocation for Kana Sequence Segmentation with Conditional Random Fields
2008年
Unmixed Spectrum Clustering for Template Composition in Lung Sound Classification
2008年
Comparing LDA with pLSI as a Dimensionality Reduction Method in Document Clustering.
2008年
Clustering Images with Multinomial Mixuture Models.
8th International Symposium on advanced Intelligent Systems (ISIS 2007) 2007年
書誌情報における著者名の曖昧性解消のためのクラスタリング手法の提案
第18回データ工学ワークショップ 2007年
Clustering Images with Multinomial Mixuture Models.
2007年
Link-Based Clustering for Finding Subrelevant Web Pages
Third International Workshop on Web Document Analysis 2005年
Link-Based Clustering for Finding Subrelevant Web Pages
2005年
Web Page Grouping Based on Parameterized Connectivity
The 9th International Conference on Database Systems for Advanced Applications 2004年
Web Page Grouping Based on Parameterized Connectivity
2004年
パラメータ化された連結性とWebページのグループ化への応用
第2回 情報科学技術フォーラム (FIT2003) 2003年
パラメータ化された連結成分分解を用いたWeb情報の有効利用
夏のデータベース・ワークショップ DBWS2003 2003年
パラメータ化された連結性に基づくWebページのグループ化
第14回データ工学ワークショップ 2003年
パラメータ化された連結性に基づくWebページのグループ化
第1回 情報科学技術フォーラム 2002年
パラメータ化された連結成分分解によるWebページのグループ化
夏のデータベースワークショップ DBWS2002 2002年
Enumeration of Regular Triangulations
12th annual ACM Symposium on Computational Geometry 1996年
Enumeration of Regular Triangulations
1996年
部分文字列の出現頻度を文書の特微量として用いたベイズ的トピックモデルに関する研究
統計学的ライムを利用した情報ナビゲーション
外的知識を利用としたッマルチトピック・モデルによる多様なテキスト情報の連結
「情報処理学会論文誌:データベース(TOD)」編集委員
テキストの時間情報を利用したマルチトピック・ モデルによる文書間・単語間類似度への時間性の導入
テキストの時間情報を利用したマルチトピック・モデルによる注目すべき話題群の時間的変遷の分析
コーパスの構成要素としての文書と単語列としての文書を架橋するトピックモデル
日本学術振興会 科学研究費助成事業
正田 備也
2021年4月 - 2024年3月
課題番号:21K12017
配分額:4030000円 ( 直接経費:3100000円 、 間接経費:930000円 )
本研究の目的は、コーパスに特殊的な文書エンコーダとしてのトピックモデルに、汎用性のある分散表現を与える文書エンコーダとしてのトランスフォーマ言語モデルを組み合わせ、トピックモデルによるトピック抽出の質を向上させることであった。
初年度は、トピックモデルの変分推論にトランスフォーマを組み合わせる準備として、多層パーセプトロン(MLP)を用いた簡易的な単語埋め込みを使って変分推論を実現し、perplexityやNPMIで定量評価するところまで達成した。成果は国際会議SIMBig 2021で発表済みである。
初年度の研究の貢献は、研究計画時は想定していなかった問題を解決した点にある。その問題とは、変分オートエンコーダ(VAE)の枠組みをトピックモデルに利用することの著しい難しさである。原因はcomponent collapseであり、過去にも同じ問題に対処しようとしたことがあった。その際は、結局、component collapseを引き起こすKL情報量の効き方を手動で調整するなど、アドホックに対処していた。今回は、Pyroが公式サイトで公開しているProdLDAの実装例も試すなどしたが、やはり、どのデータ集合でも通用する汎用性のある仕方でこの問題に対処はできず、推論のやり方自体を再検討した。
その結果、SIMBig 2021の論文では、LDAの原論文に掲載されている変分下界(ELBO)をそのまま最大化する手法を提案した。つまり、VAEは使っていない。ELBOに現れる事後分布パラメータをMLPでreparameterizeすることによって、分散表現を与える文書エンコーダとトピックモデルとを組み合わせるための、新しい道を開いた。
トピックモデルにおけるRNNの利用の有効性に関する研究
日本学術振興会 科学研究費助成事業 基盤研究(C)
正田 備也
2018年4月 - 2021年3月
課題番号:18K11440
配分額:4420000円 ( 直接経費:3400000円 、 間接経費:1020000円 )
平成30年度発表の研究実績は以下の4つである。
(1)文書モデルでのAVB(adversarial variational Bayes)の利用(ICDPA2018フルペーパー): 本研究課題はトピックモデルにおけるRNNの利用をテーマとする。その際、事後分布推定方法として変分ベイズ推定(VB)を使う。VBにおける近似事後分布の設定手法として、深層学習分野では主に変分オートエンコーダ(VAE)が使われる。VAEでは対角正規分布が近似事後分布としてよく用いられ、そのパラメータをELBOを最大化して求める。一方、より柔軟な近似事後分布を設定する手法としてAVB(敵対的変分ベイズ)が2017年にMeschederらによって提案された。これを文書モデリングに使い、柔軟な事後分布近似を実現した。
(2)RNNによる和歌自動生成(ICCS2018ポスター):約14万件の和歌をRNNに学習させ、和歌を自動生成する手法を提案した。生成された和歌のスコア付けにはトピックモデルを使い、高スコアのものだけ出力する。この研究を通してRNNの訓練に関する経験を蓄積できた。
(3)時間情報を利用したLDAのためのミニバッチ変分ベイズ推定(PRICAI2018ショートペーパー): LDAのVBに深層学習フレームワークを使うことはそれほどまだ広くおこなわれていない。この研究ではトピック毎の単語確率分布に時間情報を反映させたLDAを、PyTorchのテンソルのブロードキャストを利用して実現した。
(4)トピックモデルでのAVBの利用(ADMA2018ショートペーパー): この研究は、(1)の継続で、AVBをトピックモデルの変分推定に利用した。これにより、トピックモデルにおいてもAVBを柔軟な事後分布近似のために使えることが分かった。その結果、RNNを使ったトピックモデルへのAVBの適用可能性の感触を得た。
半導体製造ラインにおける欠陥発生予測のためのデータ処理及び、分析アプローチの探索
ソニーセミコンダクタマニュファクチャリング(株)
2019年4月 - 2020年3月
担当区分:研究代表者 資金種別:産学連携による資金
配分額:2730000円 ( 直接経費:2481000円 、 間接経費:249000円 )
実験情報の抽出・可視化・推薦のための電子図書館システムの研究
日本学術振興会 科学研究費助成事業 基盤研究(B)
高須 淳宏, 正田 備也
2015年4月 - 2018年3月
課題番号:15H02789
配分額:15860000円 ( 直接経費:12200000円 、 間接経費:3660000円 )
学術情報からの情報抽出の課題については、平成28年度に引き続きテキスト分析の研究を行った。平成28年度はCRFを用いた情報抽出を行ったが、平成29年度は深層学習を用いた学術文献本文の分析および情報抽出を行い抽出精度の向上をはかった。文献に含まれる実験情報の抽出においては、実験結果をまとめた表の解析に取り組んだ。表は基本的にはn行m列のセルの並びとなるが、複数の行や列にまたがる複合的なセルもある。本研究では、セルの境界を表中のテキストのアライメントに基づいて抽出する方法を考案した。これにより複数行(列)にまたがるセルを含む不定形な表かの情報抽出を可能とした。国際会議ICDARで行われた表理解のコンペティションで作成された評価コーパスを用いて性能評価を行ったところ、考案した手法はコンペティションで最も高い精度を達成した手法と同等の精度を有することを確認した。
情報推薦の研究では、ニューラルモデルを用いた利用者およびアイテムのembedding法について研究を進めた。モデルの学習には一般に大規模な訓練データが必要になるが、システムの利用者から訓練データを収集するのは容易でない。そこで、利用者から比較的容易にデータ収集が可能なシステムの利用ログを併用する方法について検討を進めた。アクセスログ情報をコンテキストとするニューラルネットワークを用いることで情報推薦の精度を高められることを確認した。また、アイテムに関するコンテキストを活用することで、「置き換え可能なアイテム」や「相補的な役割を果たすアイテム」など、アイテム間の詳細な関係を抽出できる可能性があることがわかった。
タイニーデータマイニング:基底としての確率分布による大規模データの再構成
日本学術振興会 科学研究費助成事業 基盤研究(C)
正田 備也
2014年4月 - 2017年3月
課題番号:26330256
配分額:4810000円 ( 直接経費:3700000円 、 間接経費:1110000円 )
この研究は規模の大きなデータの要約を目指しています。主に扱うのは文字で書かれたデータ、つまりテキストデータです。ニュース記事、学術論文、小説などがこれにあたります。テキストデータも量が多くなってくると、ひとつひとつ人間が目を通すわけにいかなくなります。そこで要約を作ります。この研究が作る要約は単語リストです。例えば「試合、ヒット、ピッチャー、トレード」という単語リストを見ると、私たちはこれが野球というトピックを表していると分かります。このような単語リストを膨大なテキストデータから自動的にいくつも取り出し、文章をひとつひとつ読まなくても何が書いてあるか分かるようにするのが、この研究の目的です。
確率的生成モデルの合成による情報アライメントの研究
日本学術振興会 科学研究費助成事業 基盤研究(B)
高須 淳宏, 正田 備也, 深川 大路
2011年4月 - 2015年3月
課題番号:23300040
配分額:19890000円 ( 直接経費:15300000円 、 間接経費:4590000円 )
本研究は潜在トピックモデルを用いた情報の多様な分析法の構築を目的とし、情報に付与された時間や情報間の関連性も考慮した分析モデルを構築した。まず、時間情報とテキスト情報を同時に用いるために、文書にタイプスタンプを付与し、テキストとタイムスタンプを同時に生成するトピックモデルを考案した。さらに論文の引用のように相互にリンクされた文書を生成するトピックモデルに拡張した。本研究の応用として、研究者推薦システムを試作し、多様な情報を活用することにより、共同研究者の推薦精度の向上をはかれることを実験的に示した。
統計学的ライムを利用した情報ナビゲーション
日本学術振興会 科学研究費助成事業 若手研究(B)
正田 備也
2010年 - 2011年
課題番号:22700150
配分額:4030000円 ( 直接経費:3100000円 、 間接経費:930000円 )
本研究は、「意味的な関連性によるのではない単語の共起関係であっても,統計学的に有意な頻度で生じているならば情報収集の手掛かりとして有用性を持つ」という仮定に基づいている。この、統計学的に有意な頻度で生じる共起を、「統計学的ライム」と呼ぶ。そして、ベイズ的な確率モデルを使い、統計学的に有意な頻度で生じている単語の共起関係を抽出することを目指した。最終的に、論文末尾や研究者のWebサイトに現れる書誌情報を、著者名・論文タイトル・学術雑誌名・発表年など異なる書誌フィールドへと教師無し学習によって自動分割する、新しいLDA(潜在的ディリクレ配分法)タイプのトピック抽出法を提案できた。また、提案のモデルの分割精度を半教師付き学習により改善することに成功した。
ハイパースペクトラルデータによる遠隔計測画像のサブピクセル解析アルゴリズム
日本学術振興会 科学研究費助成事業 基盤研究(C)
喜安 千弥, 宮原 末治, 正田 備也, 堀田 政二
2005年 - 2007年
課題番号:17560376
配分額:3740000円 ( 直接経費:3500000円 、 間接経費:240000円 )
本研究は,遠隔計測によって得られたハイパースペクトラル画像を対象として,サブピクセルの情報を高精度に抽出する手法の開発を目的としている。複数のカテゴリーが画素内に混在することに起因する誤分類を低減し,さらに,画素内のカテゴリーの混在比を高精度に推定することをめざして研究を行った。まず,周辺画素を含めたコンテクストを考慮する分類手法として,分光情報を用いて混合画素か否かを判断し,空間的なコンテクストを考慮して可能性のあるカテゴリーを限定したうえで,妥当なカテゴリーに分類する方法を開発した。また,対象の分光特性が画像内で変動する場合においても画素内の混在比を高精度に推定するため,画像全体を格子状の小領域に分割し,小領域内では分光特性を一定とみなして観測データ自身から要素数および要素スペクトルを推定し,それを用いて画素内の混在比を算出するアルゴリズムを開発した.一方,単一カテゴリーからなる画素におけるスペクトルのばらつきが無視できない場合に有効なアルゴリズムとしてあらかじめ少数のトレーニングデータを与え,それを用いて単一のカテゴリーからなる画素を画像全体から選択し,解析したい混合画素ごとにその周辺にある単一カテゴリー画素を取り出して要素スペクトルを推定し,混合画素内の混在比を推定する方法を開発した.最終年度には,開発したアルゴリズムを半教師付き手法として整理し,利用できる教師データが限定されている場合に画素の分類や画素内の混在比の推定を高精度に行うアルゴリズムとした。