• HOME
  • 記事一覧
  • AWS Bedrockのマルチエージェントでブログ記事を自動生成してみた
  • AI基盤

AWS Bedrockのマルチエージェントでブログ記事を自動生成してみた

T.Akira
T.Akira
  • Agentic AI
  • AI Agent
  • AIチャット、生成AI活用基盤、生成AI
  • AWS
  • 生成AI
AWS Bedrockのマルチエージェントでブログ記事を自動生成してみた

はじめに

「ブログ記事、AIに全部書いてもらえないかな?」

そう思ったことがある方は多いのではないでしょうか。ChatGPTなどに「記事を書いて」とお願いすれば、それなりの文章は出てきます。ただ、実際に公開できるレベルかというと、情報の正確性や構成の質に不安が残ることも事実です。

そこで今回、複数のAIエージェントに役割分担させたら、もっと良い記事が作れるのでは? という発想で、AWS Bedrockのマルチエージェント機能を使ったブログ記事の自動生成を試してみました。


やったこと

AWS Bedrockエージェントを使って、以下の6つの役割を持つエージェントを構築しました。人間の編集チームをAIで再現するイメージです。

LLMにはClaude Sonnet 3.7、Web検索にはTavily Search APIを使用しています。


記事生成の流れ

利用者がスーパーバイザーにテーマを伝えると、以下の流れで記事が生成されます。

  1. 情報収集 → テーマに関する情報をWebから集める
  2. アウトライン作成 → 収集情報をもとに記事の骨子を作る
  3. 記事生成 → アウトラインに沿って本文を書く
  4. 校正ループ → 校正エージェントが指摘 → 記事生成エージェントが修正(最大3回)
  5. ファクトチェックループ → 同様に事実確認と修正(最大3回)

実際に使ってみた感想

3つのテーマで記事を生成してみました。

  • 「各種Raspberry Piの性能比較」
  • 「Next.js + PostgresでToDoアプリを作る方法」
  • 「生成AI分野におけるアジャイル開発とは?」

良かった点

  • 日本語として自然な記事が出てくる。 文法的に変なところはほぼなく、そのまま読める品質でした
  • 構成がしっかりしている。 導入→本題→まとめの流れが整っていて、読みやすい記事が生成されました
  • 情報収集がきちんと働く。 Web検索で最新情報を拾ってくれるので、LLMの学習データだけに頼らない記事になっています

気になった点

  • 処理時間が長い。 全エージェントをフル稼働させると最大で約15分かかります。ちょっと待つには長い
  • 「よくあるまとめ記事」感が否めない。 情報の整理は上手いですが、独自の切り口や深い洞察は弱い印象です。人間の手で味付けする工程はまだ必要そうです
  • エラーで生成が止まるケースがあった。 テーマと構成の組み合わせによっては途中でコケることも

今後やりたいこと

  • 高速化:エージェント間の処理を並列化して待ち時間を短縮
  • エラー時のフォールバック:途中で止まらず、理由を返して処理を継続できるようにする
  • 他のエージェント構成パターンの検証:今回はスーパーバイザー型でしたが、ディベート型や階層型なども試してみたい

まとめ

AWS Bedrockのマルチエージェントを使ったブログ記事の自動生成を試してみました。単一AIに比べて構成の整った記事が出てくる一方、処理時間の長さや独自性の弱さなど、実運用にはまだ課題があります。

とはいえ「たたき台を作ってもらって、人間が仕上げる」というワークフローであれば、十分に実用的だと感じました。引き続き改善を進めていきます。


Appendix:エージェント構成パターン別の比較

各エージェントが品質にどう寄与しているかを確認するため、構成を変えた5パターンでABテストを行いました。評価にはGPT-5を用いたLLM as a Judgeを使用し、正確性(30点)・論理性(30点)・網羅性(20点)・独創性(20点)の100点満点で採点しています。

構成パターン

評価スコア(100点満点)

処理時間(秒)

分かったこと

  • フル構成(C5)が概ね最高品質。 ただしテーマB3では校正・FC除外のC4が最高スコアに。考察系のテーマでは、修正ループが独自の表現を「無難」に丸めてしまう可能性がある
  • マルチエージェントの効果はある。 C1(単体)と比べ、どの構成でもスコアが向上
  • 品質と速度はトレードオフ。 フル構成は品質が高い反面、処理時間は最大約15分
新着記事一覧へ