Engineer's Digest - 忙しいエンジニアのための技術情報ダイジェスト

忙しいエンジニアのための技術情報ダイジェスト。前日の話題をサクッと把握!

2025/03/28 #142 - 今日の技術情報ダイジェスト

Playwright MCPとLLMを用いたブラウザ自動化

マイクロソフトが開発したPlaywright MCPは、大規模言語モデル(LLM)とウェブブラウザをシームレスに連携させる技術で、アクセシビリティツリーを活用することで、ウェブページの構造化データを用いて効率的に操作します。画像認識に比べて高速かつ軽量なため、ウェブテストの自動化、データ収集、カスタマーサポート、コンテンツ管理など、幅広い用途で活用でき、LLMによるテストケースの自動生成やスクレイピング戦略の自動調整といった機能により、開発効率の向上やコスト削減に貢献し、既に様々な業界で導入が進んでいます。

zenn.dev

ZOZOTOWNの推薦システムにおけるA/Bテストの標準化

ZOZOTOWNは推薦システムのA/Bテストを標準化することで、テストのテンプレート作成、期間の自動見積もり、有意差検定の自動化などを実現し、工程の効率化を図りました。集計定義とダッシュボードの統一、再利用可能なシステムの構築、システム改修手順書の作成によるヒューマンエラーの低減にも取り組み、結果として工数削減とヒューマンエラーの低減に成功しました。

techblog.zozo.com

MCPサーバーのセキュリティに関する考察

大規模言語モデル(LLM)と外部ツールを連携させるModel Context Protocol(MCP)サーバーのセキュリティに関する記事です。誰でも作成・公開可能なMCPサーバーですが、セキュリティリスクも存在し、Anthropic公式リポジトリ(modelcontextprotocol/servers/src)内にあるもの、または公式サービスが提供する公式リポジトリにあるもの以外はセキュリティが保証されておらず、利用は自己責任となります。Clineのマーケットプレイスも利用可能ですが、公式リポジトリほど信頼性は高くありません。MCPサーバーを利用する際には、常にセキュリティリスクを理解し、自己責任で利用する必要があることを強調しています。

zenn.dev

ChatGPT GPT-4oの画像生成機能アップデート

OpenAIがChatGPTの基盤モデル「GPT-4o」にネイティブな画像生成機能を追加し、一般公開しました。テキストレンダリング精度や複雑な指示への対応力が向上し、実用的な画像生成が可能になっています。チャット形式での画像編集や、ユーザー画像を参考にした生成にも対応しており、多様なスタイルの画像生成、高精度なテキスト描写、世界知識の活用が特徴です。安全性確保しつつ、創造的な表現の幅を広げています。

chatgpt-lab.com

Model Context Protocol(MCP)の概要と活用

Anthropicが発表したModel Context Protocol(MCP)は、生成AIと外部システムの連携を標準化するオープンなプロトコルで、USB-Cコネクタのような役割を果たし、生成AIをカレンダーやメールなどの様々なサービスと容易に連携させることで開発効率の大幅な向上を実現します。クライアント・サーバモデルを採用し、JSON-RPC 2.0プロトコルを用いて、リソース、ツール、プロンプトの3つの主要機能を提供します。既に多くのMCPサーバーが公開されており、開発者はそれらを活用してAIアプリケーションを拡張できます。開発環境、ビジネスツール、データ分析・検索の強化などへの活用が期待され、セキュリティ面も考慮された設計となっています。

zenn.dev

GPT-4oとGemini-2.0の画像生成技術比較

GoogleのGemini-2.0とOpenAIのGPT-4oが、従来の拡散モデルとは異なる自己回帰モデルを用いることで高品質な画像生成を実現しており、その技術的背景として、GoogleのPartiやFacebookのCM3leonなどのAny-to-Anyモデルの開発が挙げられます。Any-to-Anyモデルはテキスト、画像、音声などを統合的に処理できるモデルであり、Gemini-2.0とGPT-4oはその実用化例として注目に値します。

zenn.dev

ChatGPTによる画像生成と活用事例

ChatGPTの画像生成機能の進化と、その活用事例、プロンプトエンジニアリングの重要性、そしてデザイン業界への影響について解説しています。高品質な画像生成、様々なスタイルへの対応、画像の修正・加工といった機能が紹介されており、VTuberの自作、イラスト、ロゴ作成など、幅広い用途での活用例が示されています。また、プロンプト次第で精度の高い画像生成が可能である一方、AIによる画像生成技術の進歩がデザイン業界に与える影響についても言及しています。

posfie.com

Androidオープンソースプロジェクトの非公開化

GoogleがAndroid OSの開発を一部非公開化し、これまで公開されていたソースコードを社内開発に一本化しました。これは開発効率化とスピードアップが目的で、一般ユーザーやアプリ開発者への影響はほとんどありませんが、カスタムROM開発者など、一部の外部開発者には影響する可能性があります。

smhn.info

三菱商事とJFEによる川崎市データセンター建設計画

三菱商事とJFEホールディングスが川崎市に1000億〜1500億円を投資し、2030年度の稼働を目指して巨大データセンターを建設する計画です。これは、AI需要の高まりに対応するため、高性能半導体搭載サーバーを大量に運用するもので、JFEの高炉跡地を活用した再開発事業となります。日本経済新聞の有料会員限定記事として報じられており、同記事には千葉銀行の千葉興業銀行株取得に関するニュースなども含まれています。

www.nikkei.com

マイクロソフトのデータセンター計画見直し

マイクロソフトが米国と欧州で計画していた2ギガワット規模のデータセンター建設を中止しました。これはAI関連機器の供給過剰と、OpenAIとの130億ドル規模の事業の一部断念が原因で、複数のリース契約のキャンセルや延期が発生しています。一部のデータセンター資源はグーグルやメタが獲得しており、マイクロソフトは今後、AIデータセンターへの投資ペースを鈍化させる見込みです。

www.bloomberg.co.jp

Microsoftの業務ソフト向け生成AI自社開発

マイクロソフトCEOが、業務ソフト向け生成AIを自社開発すると発表しました。これまではオープンAIのChatGPT技術を活用していましたが、自社ソフトに最適化されたAIサービス提供を目指し、独自開発への転換を図ります。この発表は日本経済新聞とテレビ東京の共同取材で明らかになり、生成AIの急速な発展に伴う規制や著作権問題への対応も課題として挙げられています。

www.nikkei.com

Windows 10サポート終了とWindows 11への移行

2025年10月14日にWindows 10のサポートが終了し、セキュリティリスクの増大や様々な問題発生の可能性があるため、Windows 11への移行が推奨されています。Windows 11への移行にはPCスペックの確認とデータバックアップが必要で、移行が困難な場合はPC買い替えも検討する必要があります。

pc.watch.impress.co.jp

ChatGPTとMCPプロトコルの連携

OpenAIが開発した、様々なAIモデルとの連携を容易にする新しいプロトコル「MCP(Multi-Chat Protocol)」についての記事です。MCPは、複数のAIモデルを統一的に扱うためのSDKを提供し、開発効率の向上に貢献すると期待されています。競合企業であるAnthropicもMCPの採用を発表しており、Microsoftとの連携も示唆されていることから、MCPがAI業界における事実上の標準規格となる可能性が高いとされています。GitHubでの公開により、コミュニティによる開発も促進されます。

www.itmedia.co.jp

Claude Desktopとmcp-server-qdrantを用いたナレッジベース構築

Claude Desktopとベクトル検索エンジンQdrantを組み合わせ、ローカル環境で簡単に構築できるナレッジベース構築方法を紹介しています。テキストの意味を理解して検索できるQdrantと、MCPサーバーを用いてClaude Desktopと連携することで、チャット履歴などの情報をQdrantに保存・検索できるようになります。具体的な設定方法や利用方法についても解説しています。

zenn.dev

アクセンチュア流Microsoft Copilot活用術

アクセンチュアによるMicrosoft Copilot活用術連載の最終回として、Copilot Studioを用いた独自のチャットボットやワークフロー作成方法、SharePoint等のデータソースとの連携によるAIカスタマイズ、Copilotのロードマップと生成AIビジネスの展望が解説されています。

www.sbbit.jp

Playwright-MCPを用いたテスト自動化入門

Qiitaの記事「【Claude】Playwright-MCPで変わるテスト自動化の世界!初心者でも使えるE2Eテスト入門」では、自然言語処理を活用したブラウザ自動化ツールPlaywright MCPを用いたテスト自動化について解説しています。Node.js、Playwright MCPサーバー、Claudeクライアントの設定方法から、UIテスト、APIテスト、E2Eテストの記述方法までを分かりやすく説明しており、プログラミング初心者でも容易にテスト自動化を実装できるようサポートしています。また、優れたMCPサーバーやクライアントを発見できるHimcp.aiについても紹介しています。

qiita.com

AIによる小中学生のお悩み相談

日本の企業が開発したAI「DeepSeek V3」は、小中学生向けのお悩み相談において、人間のカウンセラーと比較して相談件数が10倍増え、満足度90%超えという成果を収めました。既存モデルを上回る高精度な文章生成能力を備え、90%以上の正解率を達成しており、IT関連企業による開発で様々な業務への応用が期待され、更なる性能向上と幅広い分野への適用が予定されています。

www.itmedia.co.jp

LLMアプリケーション開発環境構築事例

ゲーム開発会社が、大規模言語モデル(LLM)アプリケーション開発の効率化を目指し、LLMOpsシステムを構築した事例を紹介しています。LangChainやRAGなどの技術を活用したプロンプトエンジニアリングの最適化、プロンプトの実行と共有を容易にする「Prompt Store」の開発、Langflowによるビジュアルスクリプティングを用いた開発の簡素化、そしてLLMアプリの容易なデプロイシステムの構築により、開発サイクルの短縮を実現しています。

techblog.lycorp.co.jp

AI駆動開発ツールDevinの紹介と進化

AI駆動開発ツール「Devin」の概要と、2025年1~3月のアップデートによるUX向上、パフォーマンス向上、チーム開発機能強化などを解説した資料で、SlackやGitHubとの連携、複数タスクの並行処理、知識管理、テンプレート、シークレット管理、APIといった主要機能に加え、ジュニアエンジニアのような扱い方や人間による指示・レビュー、大規模コードリファクタリングを含む企業での活用事例も紹介しています。

speakerdeck.com

中国の高度なAI検閲システムのデータ漏洩

百度サーバーから漏洩した約13万件のデータにより、中国で開発されている高度なAI検閲システムの存在が明らかになりました。このシステムは、貧困、腐敗、台湾問題など多岐にわたるキーワードだけでなく、ニュアンスを含む批判的な表現も検出できる高度な技術を用いており、従来のキーワード検閲システムを凌駕する能力を持っています。このAI検閲システムは、中国政府による世論工作の一環として利用されている可能性が高いと指摘されています。

gigazine.net

Devin AIによる技術的負債解消事例

メドピア社の開発者ブログ記事では、AIエージェント「Devin AI」を用いた技術的負債解消の取り組みが紹介されています。Devin AIはクラウド上の開発環境でコードフォーマット、リファクタリング、テストコード作成などを自動化し、PR作成数の増加と生産性向上に貢献しました。一方で、複雑なタスクへの対応には人間の指示が不可欠であり、セルフレビューによる客観性の低下や開発者の疲労といった課題も指摘されています。

tech.medpeer.co.jp

GoogleドライブのGeminiによるPDF要約機能の多言語対応

Googleドライブに搭載されたAI機能「Gemini」のPDF要約・内容理解機能が、英語に加え日本語を含む28言語に対応拡大され、2025年3月26日から段階的にGoogle Workspaceの特定プラン、Google One AIプレミアム、Gemini Educationユーザー向けに利用可能になります。この機能は、PDFファイルなど様々な種類のファイルを対象に、内容の要約や関連情報の提示、情報抽出、新たなコンテンツ作成を支援します。

gigazine.net

ClickFixによるマルウェア感染攻撃

偽のエラー画面でユーザーを誘導し、Windowsキー+Rなどの特定のキー操作によってマルウェアを実行させる「ClickFix」と呼ばれる攻撃手法が紹介されています。この攻撃は、CAPTCHAや各種サービス、オフィスソフトのエラー画面を偽装し、ユーザーに特定の操作を指示することで、実際には攻撃者のマルウェアを実行させるという巧妙な手口を用いています。macOSも攻撃対象となっており、幅広いプラットフォームで被害が及ぶ可能性が示唆されています。

piyolog.hatenadiary.jp

DMMの商品レビュー自動承認システム

DMMが生成AIを用いて商品レビューの自動承認システムを構築し、従来月150時間、最大7日かかっていた承認作業を10ヶ月で60%自動化、10分以内での完了を実現しました。AIと人間の判断の一致度が高い領域を特定することで、99%の高い精度と安全性を確保しています。

speakerdeck.com

充電不要のベータボルタ電池

韓国の研究者らが、充電不要で数十年使用可能なベータボルタ電池を開発しました。これは、リチウムイオン電池の性能向上限界の克服を目指した代替技術であり、放射性炭素(炭素14)を安全に利用することで環境負荷も低減しています。従来のベータボルタ電池と比較してエネルギー変換効率を大幅に向上させ、0.48%から2.86%に引き上げました。この技術は、人工衛星や医療機器など、長期間にわたる安定的な電力供給が求められる分野への応用が期待されています。

gigazine.net

MicrosoftのAI駆使セキュリティエージェントSecurity Copilot

マイクロソフトが、AIを活用したセキュリティエージェント「Security Copilot」を発表しました。これは、フィッシング対策、情報漏洩検知、脆弱性修正といったセキュリティ対応を自動化することで、セキュリティ担当者の作業負担軽減と効率化を目指すものです。6種類のAIエージェントに加え、パートナー企業からの追加エージェントも提供され、生成AIを活用した高度なセキュリティ対策を実現しています。

www.publickey1.jp

JAWS DAYS 2025におけるAWSセキュリティ運用の自動化講演

NRIネットコムがJAWS DAYS 2025で発表した内容は、AWSのセキュリティ運用自動化に関するもので、GuardDutyやInspectorといったAWSサービスを活用したセキュリティ運用上の課題と、それらを自動化することで効率化を図る方法について解説しています。具体的には、WAFのIPセット自動更新、チャットツールとの連携、AWSサービスのみを用いた自動化パターン、Configを用いた自動修復機能とその堅牢性・コスト・マルチアカウント環境での運用方法などが紹介され、自動化の範囲とガバナンスのバランスの重要性も強調されています。

tech.nri-net.com

AIロボット協会の設立と汎用ロボット開発

トヨタを含む24社が参加する一般社団法人AIロボット協会(AIRoA)が設立され、2025年度からAIとロボット技術を融合した「ロボットデータエコシステム」構築に向けた本格的な活動を開始します。早稲田大学発のこの協会は、大規模なデータ共有を通じて汎用ロボットの開発を促進し、産業応用や社会実装を目指しており、ロボット基盤モデル開発や国内外の研究機関との連携によるAIロボット開発コミュニティの活性化にも取り組む予定です。

pc.watch.impress.co.jp

セマンティックレイヤーの概要と分析基盤への応用

stable株式会社の宮崎氏がFindy講演で発表したセマンティックレイヤーについて解説しています。分析基盤における「ラストワンマイル問題」の解決策として、事前に定義された指標からSQLを自動生成するセマンティックレイヤーが有効だと説明しており、ディメンション、メジャー、リレーションを定義することで、ユーザーはSQLを記述することなくデータ分析が可能になります。一方で、導入にあたってはデータエンジニアのリソース不足や、データモデリングの重要性が課題として挙げられています。

speakerdeck.com

営業AIエージェント開発におけるLLM品質保証

Algomatic Tech Blogの記事「「生成AIこんなものか」と諦める前に 営業AIエージェント開発現場から学ぶLLM品質保証テクニック」では、営業支援AIエージェント開発における大規模言語モデル(LLM)の出力品質保証の難しさ、特にブラックボックス性とテストの限界を解説し、LLM出力品質を担保するための3つの戦略として、エラーパターンの言語化と継続的改善、評価と生成のプロンプト分離、不確実性の明示と人間との協働を提案しています。具体的なプロンプト改善例や、回答生成と評価のプロンプト分離による精度向上、LLMの「判断保留」機能による誤り低減策なども紹介しており、完璧なプロンプト作成よりも、LLMの限界を踏まえた品質管理体制構築の重要性を強調しています。

tech.algomatic.jp