強化 2026/03/16

Kensho Extract

Kensho Extract now offers a containerized version to support on-premises workflows.

続きを読む

Kensho Extractは、文書を構造化し、テーブル、テキスト、図を迅速かつ確実に抽出する高度な機械学習ソリューションです。文書レイアウト分析と表抽出機能により、Kensho Extractは文書のヘッダー、タイトル、段落、表、フッターを正確に組織化するため、ユーザーは数百ページから数秒で処理し、値を抽出することができます。構造化されていないPDFを機械可読化することで、ビジネスや財務の専門家は、これらの文書を下流のアプリケーションで簡単に使用できるようになります。

Extractを使用すると、次のことが可能になります:

  • ExtractをPDFパーサーとして実装し、下流のGenAIユースケースのR.A.Gパイプラインを強化します。
  • 乱雑なページレイアウトを解釈し、テキストをまとまりのある段落に構造化することで、効果的な分析と検索が可能になります。
  • ブラウザからアクセス可能なユーザーインターフェイスを含む、使いやすい文書抽出ツールにより、人的作業を強化します。

サービス プロバイダー情報

Kensho は S&P Global のための AI アクセラレータであり、最先端のテクノロジーを開発してビジネスを改革しています。Kensho のエリート技術タレントは最新技術を機械学習に使用し、S&P Global が利用するデータにこれまでにない幅と深みを持たせ、意思決定者のために新しい行動を起こすことができるインサイトとソリューションを生み出しました。

重要な情報

使用ケース

  • GenAI: KenshoとS&Pグローバルは、文書の前処理と標準化にKensho Extractを取り入れ、いくつかのGenAIイニシアチブで協力を続けています。例えば、Kensho ExtractはChatIQ for Market IntelligenceやChatAI for Energyなどのアプリケーションで重要な役割を果たしています。
  • テキストデータセットKensho Extractは、S&Pグローバルの機械可読ブローカーリサーチデータセットをパワーアップし、何百万ものブローカーレポートを処理し、これらの文書内のテキストを構造化しています。文書が構造化されると、データセットはテキストデータフィードを通じてクライアントに配信され、感情分析や名前実体認識などの自然言語処理(NLP)ワークフローが可能になります。
  • 表形式の情報を大規模に輸出:静的なPDF文書内のあらゆる表を検索して特定し、JSON、Excel、CSVなどの使いやすい形式に輸出します。

利点

  • 表形式抽出モデルの柔軟性:ハードコードされた "ルールベースのロジックに大きく依存する他の特定用途の表形式抽出ツールとは異なり、Kensho Extractの機械学習(ML)モデルは、はるかに幅広い文書テーブルタイプで高いパフォーマンスを発揮します。
  • An業界トップクラスの処理時間で、迅速かつ正確に文書を解析します。
  • Extracts rich, machine-readable insights for AI processing, analysis, and productivity enhancement
  • オンプレミスのワークフロー向けにコンテナバージョンをオファー

詳細