当イベントは終了しました。

PDFからテキストを取り出したい!使えるテクニックをご紹介

2021年7月27日(火) 16:00〜16:30

次回のイベント案内を受け取ろう

興味ありリストに追加しておくと次回イベント公開時に案内が届きます

興味ありリストに追加する 興味ありリストに登録済み 興味あり2人
PDFからテキストを取り出したい!使えるテクニックをご紹介

データはPDFファイルしかないのに、その中のテキストデータをどうしても取り出したいことがあります。そんなときに使えるテクニックをご紹介します。

イベント形態 オンライン
Webセミナー Zoom
料金制度 無料イベント
ジャンル >
タグ PDF PDFテキスト抽出 PDF利用 テキスト抽出 自動化
事務局 アンテナハウス株式会社ウェビナー委員会    お問合せ ※当イベントは上記の事務局によって企画・運営されており、(株)こくちーずは関与しておりません

イベント詳細

ウェビナー概要

データはPDFファイルしかないのに、その中のテキストデータをどうしても取り出したいことがあります。

  • 同じようなPDFファイルが沢山あるので、手動でテキストコピーせずにまとめて取り出したい。
  • 毎月の定型業務でレポートから数値を取り出さないといけないが、これを自動化したい。

まったくテキストの位置がかわらない固定のフォーマットであれば、ツールを使えば比較的簡単ですが、実際には、データのあるページが変わったり、レイアウトがかわったりして、自動化したいがどうしたらいいかわからない、といったことはありませんか?

本ウェビナーでは、そんなときに使えるテクニックをご紹介します。

こんな人にお薦め!

  • PDFを扱うシステムを企画・設計する人
  • PDFを扱うシステム開発者(プログラマー)

アジェンダ

  1. テキストを取り出すなんて簡単では?
    難しいケース
    • 抽出対象となるテキストを含むページが変わる 
    • ページ中のテキストの位置が変わる
    • テキストが複数ページに跨る
    • データの個数が変わる
    • 余計なデータが紛れ込む
  2. テキスト抽出の仕方
    次のステップで行います。
    1. ページを特定
    2. ページ中の位置を特定
    3. テキスト抽出
    4. 必要な情報だけフィルタ
    使う機能
    • テキスト抽出(領域指定)
    • テキスト抽出(ページ全体)
    • テキスト検索
    • 正規表現でのパターンマッチ 
  3. ページを調べる工夫
  4. ページ内のテキスト位置を調べる工夫
  5. 必要なテキストを取り出す工夫

【視聴方法について】

本ウェビナーは無料です。
ウェビナーの受付開始時間以降に申込詳細ページでオンラインイベントの「受付をする」ボタンをクリックしてください。

(参照)



開催場所

オンライン


お申込み


イベントチケット 金額(税込) 状態
PDFからテキストを取り出したい!使えるテクニックをご紹介
Zoom
無料 終了
募集期間:〜2021年7月27日(火) 16:00

イベントは終了しました



RSS

終了
イベント参加 33/100

もっと見る