知能情報処理研究室
■専門分野
人工知能、強化学習、マルチエージェント学習
■研究の内容
■研究室分野キーワード
■関連業種
強化学習と呼ばれている学習方式とそのマルチエージェント系への応用を研究しています。強化学習とは、結果に報酬や罰を与えて行動選択ルールの強化や抑制を行い、徐々に最適な行動選択法を作り上げていく学習方式です。また、マルチエージェント系とは、自律した個体が多数集まって相互作用している集団を指します。理論的な基礎研究のほかに、ロボットの経路計画や走行制御、ロボットサッカー(RoboCup)、追跡ゲーム、配送計画問題などへの応用も試みています。
情報・通信・サイエンス
全製造業
情報通信業
運輸業、郵便業
情報通信業
運輸業、郵便業
■教員研究テーマ
①非マルコフ決定過程における強化学習②強化学習のコンピュータ将棋への応用③マルチエージェントシステムにおける行動学習④ファジィ推論と強化学習の融合
■研究室テーマ
①ロボットサッカーRoboCupにおけるエージェント制御と学習②在庫管理問題③コンピュータ囲碁、コンピュータ将棋④強化学習を用いた自動作曲
■相談可能な分野
■保有機器
■研究室のスタンス
ロボット運行管理
物流・配送計画システム
交通制御
避難誘導システム
物流・配送計画システム
交通制御
避難誘導システム
全方位移動型ロボット(オムニRobo-E)
■特許番号・出願番号
- 配送問題における最適な配車と配送順序の探索装置および探索方法 05-319743 07-175504
- 制御方法 03-279607 05-120252
- 文書画像の領域分割及び識別方式 62-134420 63-298487
- 日本語処理装置 61-044740 62-202283
■主な著書
- Policy Gradient Approach for Learning of Soccer Player Agents: Pass Selection of Midfielders(2010/12 Springer刊行 ○Harukazu Igarashi 著「Intelligent Control and Computer Engineering」 p.137~148)
- Design and Application of Hybrid Intelligent Systems(2003/12 IOS press刊行 ○Seiji Ishihara 著 p.789~798)
- Robo Cup 2000: Robot Soccer World Cup IV(2001/04 Springer-Verlag刊行 ○Harukazu Igarashi 著「Lecture Notes in Artificial Intelligence」2019巻 p.445~448)
- OR事典2000(2000/05「社団法人日本オペレーションズ・リサーチ学会」 p.2244~2251)
- Robo Cup-99: Robot Soccer World Cup III(2000/04 Springer-Verlag刊行 ○Harukazu Igarashi 著「Lecture Notes in Artificial Intelligence」1856巻 p.596~599)
- Robo Cup-98: Robot Soccer World Cup II(1999/04 Springer-Verlag刊行 ○Harukazu Igarashi 著「Lecture Notes in Artificial Intelligence」1604巻 p.364~370)
- Robo Cup-97: Robot Soccer World Cup I(1998/04 Springer-Verlag刊行 ○Harukazu Igarashi 著「Lecture Notes in Artificial Intelligence」1395巻 p.420~427)
- Fifty-Storms: Team Description 2009(2009/06 ○Harukazu Igarashi 著「RoboCup 2009 International Symposium」)
- Fifty-Storms: Team Description 2010(2010/06 ○Harukazu Igarashi 著「RoboCup 2010 International Symposium & Team Descriptions」)
■主な論文
- ファジイ制御ルールにより表現された方策を持つ方策勾配法:RoboCup小型リーグにおける行動決定(2014/06 知能と情報)
- An Algorithm of Policy Gradient Reinforcement Learning with a Fuzzy Controller in Policies(2013/04 International Journal of Artificial Intelligence and Expert Systems)
- マルチエージェントシステムにおける行動制御―PSOにおける重み係数の強化学習―(2011/10 電子情報通信学会論文誌 D)
- 状態の複数の抽象化による方策こう配法の高速化―トンネル状の障害物が存在する追跡問題への適用―(2011/06 電子情報通信学会論文誌 D)
- Learning of Soccer Player Agents Using a Policy Gradient Method : Coordination between Kicker and Receiver during Free Kicks(2011/04 International Journal of Artificial Intelligence and Expert Systems)
- 方策こう配法を用いた行動学習-環境のダイナミクスと行動知識との分離-(2009/09 電気学会論文誌C)
- 非マルコフ決定過程における強化学習―特徴的適正度の統計的性質―(2007/09 電子情報通信学会論文誌D)
- Applying the Policy Gradient Method to Behavior Learning in Multiagent Systems: The Pursuit Problem(2006/06 Systems and Computers in Japan)
- 入力パターンベクトルの分布に基づくクラス分類問題の分割法(2005/07 電気学会論文誌C)
- マルチエージェント系における行動学習への方策こう配法の適用-追跡問題-(2004/03 電子情報通信学会論文誌 D-I)
- Navigation of a Mobile Robot Formulated in Terms of Discrete Optimization Problems(2003/04 Systems and Computers in Japan)
- Path Planning of a Mobile Robot by Optimization and Reinforcement Learning(2002/06 Artificial Life and Robotics)
- Design of a gravitational wheeled robot(2002/04 Advanced Robotics)
- Path-planning and navigation of a mobile robot as discrete optimization problems(2001/04 Artificial Life and Robotics)
- 強化学習を用いた自律移動型ロボットの行動計画法の提案(2001/04 人工知能学会論文誌)
- 離散最適化問題としての自律移動型ロボットの走行誘導(2001/03 電子情報通信学会論文誌D-I)
- Adjustment of Term Weights in an Energy Function Used in the simulated Annealing Approach to Vehicle Scheduling Problems(1997/04 Systems and Computers in Japan)
- SA法を用いた配送計画問題の解法におけるエネルギー関数中の重み自動調整法(1996/09 電子情報通信学会論文誌D-II)
- シミュレーテッドアニーリング法を用いた配送計画支援システム(1995/05 電子情報通信学会論文誌D-II)
- 2層確率場モデルによる逆問題の開放-エッジ情報を用いた画像修復への応用-(1994/06 電子情報通信学会論文誌D-II)
- A Solution for Combinatorial Optimization Problems Using a Two-layer Random Field Model -Mean field Approximation-(1994/04 Systems and Computers in Japan)
- 2層確率場モデルを用いた特徴点からのエッジ修復(1993/09 電子情報通信学会論文誌D-II)
- 2層確率層モデルを用いた組合せ最適化問題の解法-平均場近似-(1993/09 電子情報通信学会論文誌D-II)
- シュミレーテッドアニーリング法におけるエネルギー関数中のパラメータ値の決定法(1992/07 電子情報通信学会論文誌D-II)
- 標準正則化理論の2層確率場モデルへの拡張(1992/01 電子情報通信学会論文誌D-II)
- ニューラルネットワークモデルを用いた緩和ラベリング法の提案(1991/12 人工知能学会誌)
- Calculation of η up to ο(ε2) of Quantum Heisenberg Antiferromagnet in 1+ε Dimension(1985/06 Journal of the Physical Society of Japan)
- Renormalized Field Theory of Random Magnetic Mixtures with Competing Spin Anisotropies. II(1985/02 Progress of Theoretical Physics)
- Thermodynamic Quantities of Magnetic chains: Lade Approximants to High-temperature Expansions on the Internal energy Plane and a Poly nominal Fitting(1985/02 Journal of the Physical Society of Japan)
- Low Temperature Thermodynamics of Magnetic Chains(1984/09 Journal of the Physical Society of Japan)
- Renormalized Field Theory of Random Magnetic Mixtures with Competing Spin Anisotropies. I(1983/12 Progress of Theoretical Physics)
- Low Temperature Thermodynamics of Quantum Spin Chains(1982/02 PHYSICS LETTERS A)