Skip to content

【機能改善】PDFファイルをアップロードした際の文字認識 #1014

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
akashi0314 opened this issue Apr 18, 2025 · 0 comments
Labels
enhancement New feature or request

Comments

@akashi0314
Copy link

課題

現在、PDFファイルがスキャンされた画像ベースの場合、チャットインターフェースへの単純なアップロードでは文字認識(OCR)が行われず、テキストとして扱えません。

改善提案

PDFファイルを画像データに変換してからOCR処理を行い、テキスト抽出できるようにする機能の追加をお願いします。

期待される効果

  • 画像ベースのPDFからもテキスト情報を抽出できるようになり、文字認識可能なケースが拡大します
  • スキャンされた書類や画像化されたPDFも分析・検索対象にできるようになります

背景

エンドユーザー様から、業務で使用している画像ベースのPDF文書を処理できるようにしてほしいという要望を多数いただいております。この機能が実装されれば、ユーザーの利便性が大幅に向上します。

サンプル画像

Image
@akashi0314 akashi0314 added the enhancement New feature or request label Apr 18, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant