PDFからテキストを取り出したい!使えるテクニックをご紹介
2021年7月27日(火) 16:00〜16:30
データはPDFファイルしかないのに、その中のテキストデータをどうしても取り出したいことがあります。そんなときに使えるテクニックをご紹介します。
イベント形態 | オンライン |
---|---|
Webセミナー | Zoom |
料金制度 | 無料イベント |
ジャンル | > |
タグ | PDF PDFテキスト抽出 PDF利用 テキスト抽出 自動化 |
事務局 | アンテナハウス株式会社ウェビナー委員会 お問合せ ※当イベントは上記の事務局によって企画・運営されており、(株)こくちーずは関与しておりません |
スポンサード リンク
イベント詳細
ウェビナー概要
データはPDFファイルしかないのに、その中のテキストデータをどうしても取り出したいことがあります。
- 同じようなPDFファイルが沢山あるので、手動でテキストコピーせずにまとめて取り出したい。
- 毎月の定型業務でレポートから数値を取り出さないといけないが、これを自動化したい。
まったくテキストの位置がかわらない固定のフォーマットであれば、ツールを使えば比較的簡単ですが、実際には、データのあるページが変わったり、レイアウトがかわったりして、自動化したいがどうしたらいいかわからない、といったことはありませんか?
本ウェビナーでは、そんなときに使えるテクニックをご紹介します。
こんな人にお薦め!
- PDFを扱うシステムを企画・設計する人
- PDFを扱うシステム開発者(プログラマー)
アジェンダ
- テキストを取り出すなんて簡単では?
難しいケース- 抽出対象となるテキストを含むページが変わる
- ページ中のテキストの位置が変わる
- テキストが複数ページに跨る
- データの個数が変わる
- 余計なデータが紛れ込む
- テキスト抽出の仕方
次のステップで行います。
- ページを特定
- ページ中の位置を特定
- テキスト抽出
- 必要な情報だけフィルタ
使う機能- テキスト抽出(領域指定)
- テキスト抽出(ページ全体)
- テキスト検索
- 正規表現でのパターンマッチ
- ページを調べる工夫
- ページ内のテキスト位置を調べる工夫
- 必要なテキストを取り出す工夫
【視聴方法について】
本ウェビナーは無料です。
ウェビナーの受付開始時間以降に申込詳細ページでオンラインイベントの「受付をする」ボタンをクリックしてください。
(参照)
スポンサード リンク
開催場所
オンライン
お申込み
イベントチケット | 金額(税込) | 状態 |
---|---|---|
PDFからテキストを取り出したい!使えるテクニックをご紹介 Zoom |
無料 | 終了 |
募集期間:〜2021年7月27日(火) 16:00
イベントは終了しました
スポンサード リンク
終了
イベント参加 | 33/100 |
---|