智慧生活科技專業社群

本社群由Nantou.py使用者社群以及國立虎尾科技大學電機資訊學院負責維護，它是一群熱愛智慧生活科技以及Python的專業教師所組成，大家一同快樂地研究有關數位生活中人工智慧、大數據、物聯網、雲端服務、APPS、福祉科技、感知網路服務、車載網路服務、及網際網路等資通訊技術，並運用這些資通訊以及Python技術來提升我們的日常生活品質，建立更好的生活環境。

2025年1月9日星期四

利用Ollama整合OCR的功能

1.執行ollama

ollama pull llama3.2-vision:11b

ollama run llama3.2-vision:11b

2.安裝套件(開啟另一個cmd)

pip install ollama-ocr

3.程式

from ollama_ocr import OCRProcessor

# Initialize OCR processor
ocr = OCRProcessor(model_name='llama3.2-vision:11b')  # You can use any vision model available on Ollama

# Process an image
result = ocr.process_image(
    image_path="img.png",
    format_type="markdown"  # Options: markdown, text, json, structured, key_value
)
print(result)

執行結果：

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)

2025年1月9日 星期四

利用Ollama整合OCR的功能

沒有留言:

張貼留言

2025年1月9日星期四