GoogleのAI エージェント実践集中コースに参加し、マルチエージェントシステムを作れるようになってきた
Google Cloudが主催するAI エージェント実践集中コースが6月7、8日の日程で開催され、招待メールをいただいた自分もオフライン会場の渋谷オフィスにて参加してきました。
マルチエージェントシステムを含むAIエージェントを構築・デプロイできるようになることが最終目標でしたが、AIエージェントそのものについて学び直すよい機会になったので、ここに振り返りを公開します。
概要
AI エージェント実践集中コースは、GoogleとKaggleがこの春に提供したばかりの、AI エージェントの開発スキルやプロンプトエンジニアリングを学ぶ集中コース「5-Day Gen AI Intensive Course」を、さらに2日間に凝縮したものです。
私は普段の業務ではWebアプリケーションを開発しており、Pythonを使ったデータエンジニアリングといった領域からはやや遠かったのですが、ちょうどAI エージェントを自分で構築できるようになりたいと思っていたので、まずは手慣らしとして参加してみることにしました。
結果的に、AI エージェントについて理解を深められたのはもちろん、さまざまな企業におけるAI エージェント活用の事例や取り組みを知ることができ、開発に対するモチベーションも高まりました。
1日目のセッション
講師はGoogle Cloud カスタマー エンジニアでAI / ML スペシャリストのHaren Bhandariさんと、同じくGoogle Cloud 機械学習 スペシャリスト エンジニアのAnant Nawalgariaさんです。
最初のセッションでは、AIエージェントに先立って発展したプロンプトエンジニアリングについて説明されました。temperature、Top-P、Chain-of-Thoughts(CoT)プロンプティングなどお馴染みのものから、「まずはZero-shotから始め、必要があればFew-shotやCoTを検討する」といったベストプラクティスまで学ぶことができました。Tree-of-Thoughts(ToT)プロンプティングなど、比較的新しく私が知らない手法についても知ることができました。
(Shunyu Yaoほか「Tree of Thoughts: Deliberate Problem Solving with Large Language Models」(2023)より)
午後にはAI エージェントについての説明が続きます。単なる大規模言語モデルではなく、ツールを通して外部のシステムに接続し、マルチターンのセッション履歴の管理や、推論のための認知アーキテクチャを備えたものがAI エージェントであると説明されていました。このような認知アーキテクチャはオーケストレーション層と呼ばれ、Google Cloudがツールキットやクラウドサービスを通して提供できる領域になります。
(Build gen AI agents using Google Cloud databases | Google Cloudより)
その次はKaggleのNotebookを使ったプロンプトエンジニアリング演習です。先ほどのFew-shotやCoT・ToTなどの手法を実際のプロンプトで試したほか、データベース(SQLite)を操作するFunction Callingを、Gemini APIと連携して実行するなどしました。ツールの呼び出しは昨今のチャットボットではもはや一般的ですが、モデルへの渡し方や実際に呼ばれている様子のログなどをあらためて見られたのはよかったです。
(temperatureを上げ、日本の首都を京都と言わせようとしたものの失敗した様子)
セッションののち、AIエージェントをテーマとするLT大会も行われました。私も飛び込みで登壇し、エージェントとはそもそもなんぞやという語用論に関する小ネタを打たせていただいたりしました。
1日目の終わりは懇親会です。1時間と短い間でしたが、さまざまな業界の方と熱量あるトークができ、視野が広がる思いがしました。
(多種多彩なケータリングの料理)
2日目のセッション
2日目では本格的なAIエージェントを作っていきます。まずAI エージェントを評価するのに必要な、さまざまなレイヤーでの指標について学んでいきます。これは後ほどAgent Developer Kit(ADK)を使ってログを分析するのに役立つことになります。ネットワーク型、階層型などと分類できるAIエージェントフレームワークや、ADKおよびこれを含むVertex AI Agent Buildなどのツールキットやプラットフォームについて学び、午前中は終了です。
(Vertex AI Agent Builder の概要 | Generative AI on Vertex AI | Google Cloudより)
午後からはQwiklabを用いた演習を行います。まずはADKが提供する SequentialAgent
というエージェントの雛形を使って、Google検索ツールを渡すかたちで調べ物をしてくれるシングルAIエージェントを作ります。
次に LoopAgent
や ParallelAgent
といった他のエージェントワークフローを使って、映画の台本を書いてくれるマルチエージェントを開発していきます。これはリサーチャー、脚本家、批評家などの専門エージェントで構成され、これらが制作室などの複合したエージェントへとさらに階層化されていきます。ADKのWebUIで、エージェント同士が協調する様子のログを見るのは、作品制作の現場を監督の立場から眺めているようで壮観でした。
最後にラスボスとして、このようなAI エージェントシステムをデプロイしました。Agent Engineという、Compute Engineみたいなクラウドサービスがあり、ここにエージェントを配備していくことでマルチエージェントシステムを公開できる、とのことでした。くたくたになったところでコースの全日程が終了しました。
そのほか全体を通して
運営とのやりとりや参加者同士の交流はDiscordサーバーで行われました。なんとなくSlackみたいな印象があったので最初は意外に感じましたが、すぐに慣れました。そのなかで実況を通じて参加者同士わいわいできるといいなと思い、「許可を求めるな、許しを乞え」の精神でおもむろに実況を始めたところ、Google Cloudで運営の北瀬さんがすぐに対応するチャンネルを作ってくださいました。言葉にまとめなおすことで私自身の理解を深めることが目的だったのですが、参加者のみなさんにも好評だったと人づてに耳にし、やって良かったなという思いがしました。
(2日目、実況の期待を一身に受ける様子)
ランチ会場はGoogle Japanオフィスのあるビルの24階のカフェテリアだったのですが、壁が全面ガラス張りとなっていて渋谷の街を見下ろしすがすがしい気持ちがしました。食べ物や軽食類もバラエティ豊かで美味しかったです。
また、登壇の記念としてTシャツもいただきました。海外旅行に行く際などに着たいと思います。
おわりに
AI エージェントを作るとして何から始めればいいのかわからない、またマルチエージェントシステムともなると機構が複雑すぎて手に負えなさそう、などと参加前には感じていました。しかしGoogle Cloudが提供するADKやAgent Engineといったツールキットやサービスのおかげで、半年前(つまり2025年が始まったばかりのころ)に比べてもこれらAI エージェント開発の難易度ははるかに下がったように思います。コース自体も、基礎的な知識から発展した内容へと構成されていて、参加者はいずれもなんらかのレベルで持ち帰れるようなものになっていると感じました。このスキルをしっかりと我が物にするとともに、これから新しくより洗練されたプロダクトが開発できればよいと思います。
Discussion