Lấy text từ image mà khó =)). Công nghệ xử lý ảnh thời (gian) nay vừa tiến rất xa rồi.
- Nếu là chữ in từ tài liệu thì rất dễ, có rất nhiều thuật toán có thể đáp ứng.
- Nếu là chữ in trên các biển quảng cáo, được chụp từ nhiều góc độ thì có khó hơn 1 tý, nhưng cũng vừa xử lý tốt.
- Nếu là chữ viết tay tiếng Anh thì cũng có một số thuật toán có thể xử lý được đến 95%.
- Còn chữ viết tay tiếng Việt thì công nhận khó.
Một phần mềm có thể nhận diện chữ trong ảnh(miễn phí, phần lớn nguồn mở):
You must be registered for see links
Ví dụ 1 phần mềm có thể nhận diện chữ trong file scanned:
You must be registered for see links
.
Nếu bạn nào vừa từng sử dụng phần mềm Evernote, sẽ thấy khi gõ 1 từ vào ô search của phần mềm này, nó sẽ search cả trong các ảnh (nếu có).