Kensho Extract

Kensho Extract’s newest feature, Figure Extraction: Unlock hundreds of data points from figures
Simply upload PDF documents through the Kensho Extract UI or API, and extract data points from bar chart visualizations with high numerical accuracy. Get started here .

続きを読む

KenshoのExtractは、ドキュメントからテキストと表の両方を構造化した上でアクセスする最先端の人工知能(AI)ソリューションです。高度な機械学習(ML)モデルの活用で複雑な PDF 文書を使いやすい機械可読形式に変換します。金融とビジネスを念頭に構築されており、S&Pの金融文書の深いライブラリーを活用しています。複雑なビジネス・金融文書からインサイトを引き出すための理想的なソリューションです。

Extractは、ファイナンスとビジネスを念頭に構築されており、S&Pの財務情報の豊富なライブラリを活用しています。Extractは、複雑なビジネス文書やファイナンス文書からインサイトを引き出すための理想的なソリューションです。

Extractの使用例:

  • 構造化されていないドキュメントにおいて、ドキュメント内で検出されたヘッダー、タイトル、段落、表、フッターを自然な読み順で整理する機械可読形式へ素早く変換
  • 乱雑なページレイアウトを解釈し、テキストをまとまりのある段落へ構造化
  • ブラウザからアクセス可能なユーザーインターフェイスを含む、使いやすいドキュメント抽出ツールで人的作業を強化

サービス プロバイダー情報

Kensho は S&P Global のための AI アクセラレータであり、最先端のテクノロジーを開発してビジネスを改革しています。Kensho のエリート技術タレントは最新技術を機械学習に使用し、S&P Global が利用するデータにこれまでにない幅と深みを持たせ、意思決定者のために新しい行動を起こすことができるインサイトとソリューションを生み出しました。

重要な情報

使用ケース

  • フルテキスト検索の実現:アクセスしにくい静的なPDF文書を機械可読形式に変換し、PDFの内部文書リポジトリや仮想データルームなどの共有プラットフォームの全文文書検索を可能にします。
  • 洗練されたNLPソリューションへのフィード:アクセス不能な静的 PDF 文書を機械可読文書形式に変換し、キー・バリュー・ペア (KVP) 抽出、名前付きエンティティ認識 (NER)、トピック・モデリングなど、より高度な自然言語処理 (NLP) ソリューションを有効にし、実用的なインサイトを生成します。
  • 大規模な表形式情報の輸出:静的なPDF文書内のあらゆるテーブルを検索・識別し、JSON、Excel、CSVなどのユーザーフレンドリーな形式に輸出します。

利点

  • 表抽出モデルの柔軟性:ハードコード化されたルールベースのロジックに大きく依存する他の特定用途の表形式抽出ツールとは異なり、Kensho Extractの機械学習(ML)モデルでより幅広い文書テーブルタイプにおいて高いパフォーマンスを発揮します。
  • ビジネス&ファイナンスニッチ: 複雑なレイアウトの金融文書において、より汎用的な抽出製品を凌駕します。
  • 独自のS&P財務トレーニングデータ:他の抽出ベンダーがオープンソースデータに依存しているのに対し、Kensho ExtractはS&P Globalの豊富なドキュメントリポジトリを活用しています。
  • スピードとスケーラビリティ:他ベンダーより10倍速い処理パフォーマンスで、数百万ページを一括処理します。

詳細