妹尾 卓磨

Seno Takuma

Message

スターウォーズが大好きでR2-D2を作るのが夢です。現在は慶應大学今井研究室で深層強化学習の研究を行っています。エージェントが好奇心に基づいて環境を探索するなどの、自分で自分自身の学習を促す手法が今後の強化学習の肝になると考えているので、その方面で研究しています。

Biography

  • 2014年3月 慶應義塾高等学校 卒業.
  • 2014年4月 慶應義塾大学 理工学部 入学.
  • 2016年6月 UC Berkeley Summer Session CS61c
  • 2018年3月 慶應義塾大学 理工学部 卒業
  • 2018年4月 慶應義塾大学大学院 理工学研究科 開放環境専攻 入学

現在同大学院修士過程(今井研究室所属)

Internships

  • *SONY株式会社(深層学習R/&/gDエンジニアアルバイト)
  • SONY株式会社(深層学習R&Dエンジニアインターン)
  • Wantedly株式会社(Web/機械学習エンジニア)
  • SONY株式会社(UX開発本部クラウドエンジニア)
  • マッチングッド株式会社(クラウドエンジニア)

Awards

  • 2018年 第4回全脳アーキテクチャハッカソン 優秀賞&ふるや総合会計事務所AGI賞
  • 2018年 第80回情報処理学会全国大会 学生奨励賞 「深層強化学習によるロボットの無報酬な環境の探索」
  • 2017年 HAIシンポジウム2017 学生奨励賞 「予測的認知と「間」の関係 ―言葉を話せないロボットによるしりとりを題材とした考察―」
  • 2017年 第3回全脳アーキテクチャハッカソン 最優秀賞

Publications

国際会議

[3] Takuma Seno, Kohei Okuoka, Masahiko Osawa, Michita Imai, "Adaptive Semi-autonomous Agents via Episodic Control", 6th International Conference on Human-Agent Interaction (Poster), 2018
[2] Takuma Seno, Masahiko Osawa, Michita Imai, "An Intrinsically Motivated Robot Explores Non-reward Environments With Output Arbitration", Annual International Conference on Biologically Inspired Cognitive Architectures, 2018
[1] Masahiko Osawa, Yuta Ashihara, Takuma Seno, Michita Imai, Satoshi Kurihara, Accumulator Based Arbitration Model for both Supervised Learning and Reinforcement Learning Inspired by Prefrontal Cortex, ICONIP2017.

国内会議

[6] Takuma Seno, Masahiko Osawa, Michita Imai, “Dynamic NOOP Insertion Improves Performance of Pre-trained Deep Reinforcement Learning Model”, 28th Annual Conference of Japanese Neural Network Society, 2018.
[5] 妹尾卓磨, 大澤正彦, 今井倫太, “深層強化学習によるロボットの無報酬な環境の探索”, 第80回情報処理学会全国大会, 2018.
[4] 松森匠哉, 妹尾卓磨, 菊池俊基, 滝本佑介, 大澤正彦, 今井倫太, “Embedding Cognitive Map in Neural Episodic Control”, 第7回汎用人工知能研究会, 2017.
[3] 大藤聖菜, 妹尾卓磨, 清丸寛一, 川崎邦将, 大澤正彦, 長田茂美, 今井倫太, “予測的認知と「間」の関係 ―言葉を話せないロボットによるしりとりを題材とした考察―”, HAIシンポジウム, 2017.
[2] 妹尾卓磨, 大澤正彦, 今井倫太, “無報酬な環境での深層強化学習によるロボットの行動獲得”, HAIシンポジウム, 2017.
[1] 妹尾卓磨, 大澤正彦, 今井倫太, “Accumulator Based Arbitration Model DQN: 複数モジュールを調停した深層強化学習手法”, 第27回神経回路学会全国大会, 2017. (口頭発表)

Activity in WBA