LLMエージェントの評価・監視OSS「Future AGI」
「動く」と「使える」の間に横たわる深い溝 「動くプロトタイプなら、週末のハッカソンで作れる。でも、それを本番環境で安定稼働させるには、数ヶ月の血の滲むようなデバッグが必要になる」 最近、スタートアップのCTOや大企業のA … 続きを読む
AI、ガジェット、Webサービスなど、技術の最前線をエンジニアの視点で解説するテクノロジー情報です。現役SESエンジニアとしての経験を活かし、単なるニュースの要約にとどまらない深い洞察と実무的な活用方法をお届けします。
「動く」と「使える」の間に横たわる深い溝 「動くプロトタイプなら、週末のハッカソンで作れる。でも、それを本番環境で安定稼働させるには、数ヶ月の血の滲むようなデバッグが必要になる」 最近、スタートアップのCTOや大企業のA … 続きを読む
AIでWebゲームを全自動生成する「OpenGame」とは ここ最近、CursorなどのAIコーディングツールを使っていて、ある種の「もどかしさ」を感じることはないだろうか。単一の関数やアルゴリズム、独立したコンポーネン … 続きを読む
クラウド黎明期、AWSのマイクロインスタンスやHerokuの無料枠をパズルのように組み合わせ、1円も払わずにシステムを稼働させようと血道を上げるハッカーたちがいた。時代は変わり、今ネット上にばら撒かれているのは単純なコン … 続きを読む
演算の限界を叩き出す「言語」の正体 最近、メガテック企業のカンファレンスや論文を眺めていると、奇妙な既視感を覚えることがある。かつてWebブラウザのレンダリング速度をミリ秒単位で削り合っていた時代のように、今は誰もが「G … 続きを読む
登壇資料のデザインに奪われる週末 カンファレンスの登壇が決まるたび、頭を抱えるのは「話す内容」よりも「見せ方」だったりする。PowerPointやKeynoteの真っ白なキャンバスは、エンジニアにとって自由すぎるのだ。少 … 続きを読む
LLMと因果推論でROI予測するAIツール「oransim」 企業のマーケティング予算を決定する会議室で、私は幾度となく同じ光景を目にしてきた。数千万、時には億を超えるキャンペーン予算の承認を求める現場に対し、経営陣は決 … 続きを読む
最近、CursorやClaudeを傍らに置いてプロトタイプや簡単なランディングページを組むたびに、ある種の「既視感」に襲われることが増えた。 プロンプトを投げれば、ものの数秒でレスポンシブなWebページが組み上がる。エラ … 続きを読む
AIが書いたテキストを、誰が「清書」するのか ChatGPTやClaudeが紡ぎ出すテキストの質が、日常業務において人間のそれを凌駕する瞬間が増えてきた。しかし、そのテキストを上司やクライアントに提出する「ドキュメント」 … 続きを読む
ピクセルをターミナルから叩き出す時代 開発の現場において、デザインとエンジニアリングの境界線は常に悩ましい断層だった。Figmaのカンバスに描かれた美しいモックアップを前に、どうやってこれをDOMツリーとCSSに翻訳する … 続きを読む
「信頼感のある青」をAIにどう伝えるか 「この青色には、もう少し信頼感を持たせたいんです」 会議室でデザインチームから渡された分厚いPDFのブランドガイドラインを眺めながら、フロントエンドの実装方針に頭を悩ませた経験は、 … 続きを読む