DellのOptiprex3060利用していますが、最近よくフリーズ(暗転、無反応、チップセットが逝ったか?)するようになり、コールドブートを頻繁に行っていたところ、ついに立ち上がらなくなったのでWindowsを初期化。。なぜか嘘のようにフリーズ現象が解消されました。
初期化され、アプリはなくなりましたが、最近はローカルマシンへの依存がそこまで大きくなくなってきたのでそれほど初期化してもダメージはない。



あと、RAG(Retrieval-Augmented Generation)調査中ですが、少し前から言語モデル(LLM)で画像の識別や生成が可能になっている。本来これはCNNの領域なのではと思っていたのですが、最近LLMは「マルチモーダルモデル」へと進化してきており、Transformerが万能化してきているらしい。つまり、文章・音声・画像・動画・DNA・センサ・ロボット制御を入力としてTransformerが扱えるようになってきている。内部的には、Transformerが、画像・文章を受け取ると、まず話の文脈と、文章、画像はVision Encoderでトークン化->ベクトル化->LLMで統合処理ー>回答という流れ。
近いうちに「机の上の赤いマグカップ探して」や「回路図の問題点教えて」が可能になる。