kirintropのブログ

はるか遠いミニマリストへの道です。

12-生成AIと何とか話。

なんだかんだでPythonを触り続けてる。
何となく何を書いてるか判るようになってきているようにも感じる。

1個目
試行して使えるようになった。
自動でサイトにログインしてブラウザを使わずに直接データをDLするような代物。
定番といえば定番なのだろうけど、まず試してみるには格好のものだった。

2個目
なかなか完成せず。
方向性が安定しなくて暗礁に乗り上げてきている。

PDFをなんやかんやしてOCRで全文をテキストにしていい感じの音声読み上げを目論んでいた。

OCRで読めるようにするには、まずはちょっといい感じの画像にする。
といっても、ぼやけていなくてちゃんとクッキリとした文字にする程度。

人の目で見ても明らかに読めるのにOCRでは読めないところが出てきて、読み取り精度はお手上げ。

いい感じのPDFを作れるような方を目指したところで、
白黒とグレースケールとカラーの判定に躓く。

グレースケールの文書ってほとんど白い。
文字の黒いところと限りなく白に近いグレーのところが意外と同じ割合だったりする。
元々の紙の焼け具合とかでも変わるのだろう。

画像を見て単純に白黒なのか本当のグレースケールなのかを簡単に見分けるロジックは意外とないらしい。


カラーも然り。
PDFを読むときに動作を早くするために最適化しようとしているけれど、なかなか上手くはいかない。

kirintropは、Amazon.co.jpを宣伝しリンクすることによって
サイトが紹介料を獲得できる手段を提供することを目的に設定された
アフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。