Các chương trình tốt nhất để nhận dạng văn bản. Quét và nhận dạng văn bản

Nhận dạng văn bản quang học là một quá trình trong đó văn bản được chụp hoặc quét được chuyển đổi thành định dạng tài liệu bằng một chương trình đặc biệt.

Nghĩa là, thay vì một bức ảnh, bạn sẽ có văn bản được đánh máy chuẩn có thể chỉnh sửa được.

Trong tài liệu này, chúng ta sẽ thảo luận về chương trình nhận dạng văn bản nào tốt hơn (TOP 7 tiện ích được đưa ra dưới đây).

Sự lựa chọn

Làm thế nào để chọn được chương trình phù hợp nhất và phần mềm đó có những tính năng chính gì?

Nó có thể khác nhau ở nhiều chỉ số khác nhau - độ chính xác nhận dạng, khả năng làm việc với một ngôn ngữ cụ thể, khả năng bảo tồn cấu trúc ban đầu của văn bản, v.v.

Phần mềm như vậy có thể được phân phối có tính phí hoặc miễn phí và có thể được triển khai cả trực tuyến (dưới dạng dịch vụ đặc biệt) và dưới dạng chương trình được cài đặt sẵn.

Thuật toán của công việc là đối với mỗi chữ cái trong bảng chữ cái, một cơ sở dữ liệu về các tùy chọn về cách nó trông như thế nào trong ảnh được tổng hợp, các thành phần chính của nó được đánh dấu và lưu lại. Ngay sau khi phát hiện các yếu tố như vậy trong ảnh, chương trình sẽ nhận dạng chữ cái tương ứng. Tùy thuộc vào mức độ tốt và chi tiết của cơ sở dữ liệu đó được biên soạn, chất lượng nhận dạng tài liệu cuối cùng sẽ phụ thuộc.

Do đó, điều quan trọng là phần mềm phải được thiết kế để hoạt động riêng với tiếng Nga (một số chương trình có thể hoạt động với văn bản viết bằng hai ngôn ngữ cùng một lúc, những chương trình khác thì không).

Ngoài ra, một số tiện ích và dịch vụ thậm chí có thể giữ nguyên cấu trúc ban đầu của văn bản (, danh sách), loại thiết kế của nó (thụt lề, v.v.) và thậm chí cả.

Trong trường hợp nào phần mềm như vậy là cần thiết?

  • Khi tạo tài liệu khi chỉ có sẵn bản in;
  • Khi biên soạn các bản tóm tắt, báo cáo và nhu cầu trích dẫn một đoạn văn lớn trong một cuốn sách;
  • Đối với công việc biên tập, khi văn bản chỉ có ở dạng ảnh, v.v.

Trên thực tế, phạm vi sử dụng của phần mềm rất rộng và nếu chọn đúng, nó có thể giúp việc làm việc với văn bản trở nên dễ dàng và nhanh chóng hơn.

Thông số kỹ thuật

Phần mềm này khác nhau về nhiều mặt: phương pháp triển khai (trực tuyến hoặc dưới dạng tiện ích), giấy phép sử dụng (trả phí hoặc miễn phí), danh sách ngôn ngữ được công nhận, chất lượng công nhận, v.v.

Để người dùng có thể đưa ra lựa chọn đúng đắn nhanh nhất có thể, bảng dưới đây trình bày các đặc điểm chính của các chương trình đó.

Tiêu đề Giấy phép Đang quét Kiểm tra chính tả Dịch Xử lý văn bản trong trình soạn thảo Làm việc với văn bản viết tay Làm việc với hình ảnh chất lượng kém
Abbyy Fine Reader Trả phí, dùng thử miễn phí 10 ngày Đúng Đúng Đúng một phần một phần Đúng
Mẫu OCR Cunei Miễn phí Đúng Đúng KHÔNG Đúng KHÔNG Đúng
Readiris Pro KHÔNG Đúng KHÔNG Đúng Đúng Đúng
OCR miễn phí Miễn phí Đúng KHÔNG KHÔNG Đúng KHÔNG Đúng
Trình đọc ảnh chụp màn hình Abbyy Trả phí, dùng thử miễn phí 14 ngày KHÔNG Đúng Đúng KHÔNG KHÔNG một phần
Adobe Acrobat Trả phí, dùng thử miễn phí 7 ngày Đúng KHÔNG KHÔNG một phần KHÔNG một phần
OCR trực tuyến miễn phí Miễn phí KHÔNG KHÔNG KHÔNG KHÔNG một phần Đúng

Tất cả các tiện ích liệt kê trong bảng dưới đây đều được mô tả chi tiết và được xếp theo thứ tự TOP, từ tốt nhất đến tệ nhất.

Abbyy Fine Reader

Đây là phần mềm đa chức năng và chất lượng cao nhất trong TOP này. Nó được phân biệt bởi độ chính xác nhận dạng cao và có một số lợi thế; nó được phân phối có tính phí.

Chương trình hoạt động thành công với nhiều ngôn ngữ; trong quá trình nhận dạng, nó có thể giữ nguyên cấu trúc của văn bản và kiểu định dạng.

Nó dành cho các chuyên gia, do đó, theo hầu hết người dùng, nó đáng đồng tiền bát gạo.

  • Số lượng lớn các ngôn ngữ được hỗ trợ;
  • Khả năng duy trì kiểu định dạng và đặc điểm cấu trúc của tài liệu khá chính xác;
  • Có sẵn phiên bản dùng thử miễn phí trong 10 ngày;
  • Không giảm chất lượng ngay cả với số lượng lớn văn bản (điều thường thấy ở các chương trình khác nhận dạng văn bản ngày càng kém hơn với mỗi ảnh được tải lên tiếp theo và sự cố chỉ được khắc phục sau khi khởi động lại).

Các bài đánh giá về phần mềm này rất khác nhau: “Đây là một chương trình tốt, nó giúp ích rất nhiều cho công việc của bạn”, “Nó không đáng tiền - cũng có những chương trình miễn phí có chất lượng nhận dạng tương tự”.

Mẫu OCR Cunei

OCR Cunei Form có lẽ là một trong những chương trình tiện lợi và hữu ích nhất trong số những chương trình được phân phối miễn phí.

Cung cấp chất lượng nhận dạng khá cao và hoạt động ngay cả với những bức ảnh chất lượng kém.

Chương trình cho phép bạn chỉnh sửa ảnh trực tiếp khi làm việc với nó và nhận dạng phông chữ và cấu trúc khá tốt (mặc dù nó không hoạt động với văn bản viết tay).

Có khả năng gửi trực tiếp chúng đến người biên tập ở dạng văn bản.

Nó có tốc độ hoạt động khá khả quan.

  • Sự công nhận chất lượng cao;
  • Hỗ trợ một số lượng lớn ngôn ngữ;
  • Phân phối miễn phí;
  • Tốc độ khá cao.
  • Thiếu trình dịch tích hợp;
  • Không có chất lượng kiểm tra chính tả;
  • Thiếu khả năng làm việc với văn bản viết tay.

Người dùng đánh giá về chương trình này như sau: “Phần mềm tốt”, “Vì chương trình này miễn phí nên nó hoạt động tốt”.

Readiris Pro

Readiris Pro là một phần mềm trả phí khác cung cấp công việc khá đa dạng và ổn định về nhận dạng và chỉnh sửa bài kiểm tra.

Bạn đã bao giờ gặp phải nhu cầu quét một cái gì đó, chẳng hạn như một số tài liệu? Cho dù đó là tài liệu văn bản hay chỉ là ảnh chụp, chương trình RiDoc vẫn lý tưởng cho “người dùng” thông thường vì có giao diện đơn giản, thiết thực và cực kỳ thân thiện với người dùng.

RiDoc là chương trình scan tài liệu, cho phép bạn số hóa thông tin, nghĩa là chuyển thông tin từ giấy sang kỹ thuật số (ổ cứng máy tính), từ đó đơn giản hóa cuộc sống của người dùng và cứu rừng. Ngoài ra, những tài liệu đó có thể được gửi qua email hoặc tải lên bộ nhớ đám mây và cung cấp quyền truy cập cho những người dùng khác (tùy theo nhiệm vụ).

Ngoài ra, RiDoc còn cung cấp chức năng có thể điều chỉnh kích thước của tài liệu kỹ thuật số (bằng cách chọn chất lượng hình ảnh). Giao diện có một công cụ cho phép bạn nhận dạng văn bản từ máy quét (thông tin văn bản), cũng như lưu giữ lịch sử của tất cả các tài liệu đã quét trước đó (ví dụ: ở định dạng pdf).


Ứng dụng này cho phép bạn lưu các phiên bản kỹ thuật số của tài liệu ở các định dạng phổ biến nhất: bmp, tiff, jpeg, png, Word, PDF, rất thuận tiện vì hầu hết người dùng máy tính đều có phần mềm để làm việc với các tệp này, ngoài ra, phần mềm tương ứng các ứng dụng luôn có thể được tải xuống miễn phí từ cổng thông tin của chúng tôi.

Thông thường RiDoc được sử dụng như chương trình scan của hp và canon thiết bị do thực tế là thiết bị này cực kỳ phổ biến đối với hầu hết người dùng. Nhưng điều này không có nghĩa là các nhà sản xuất khác vẫn đứng ngoài cuộc - RiDoc tương tác hoàn hảo với bất kỳ mẫu máy quét hiện có nào, vì vậy bạn có thể tải xuống chương trình miễn phí này để quét tài liệu bằng tiếng Nga một cách an toàn.

Chức năng chính của phần mềm:

  • Có công nghệ “thư mục nhanh” cho phép bạn thoải mái quản lý tài liệu số hóa;
  • Nếu bạn có một tài liệu văn bản giấy mà bạn muốn chuyển sang máy tính của mình thì chương trình có thể thực hiện nhận dạng văn bản, sau này có thể chỉnh sửa văn bản này trong bất kỳ trình soạn thảo văn bản phổ biến nào, chẳng hạn như OpenOffice hoặc Microsoft Word;
  • Chức năng hình mờ. Người dùng được trao cơ hội điều chỉnh kích thước của nó, có tính minh bạch được chỉ định trước đó;
  • Tất cả các tài liệu PDF được quét (số hóa) có thể được đặt trong một tệp để lưu trữ nhỏ gọn hơn, khả năng thiết lập các tham số thống nhất cho từng chức năng riêng lẻ.
  • Có một máy in RiDoc tích hợp cho phép bạn xuất tệp sang định dạng PDF;
  • Tất cả các tập tin được quét có thể được gửi đi in một cách tự nhiên;

Chúng tôi đề xuất phần mềm này như một ứng dụng không thể thiếu, hữu ích cho cả sinh viên và người dùng thông thường, đồng thời cũng sẽ trở thành công cụ không thể thiếu đối với nhân viên văn phòng. Để tải xuống chương trình, chỉ cần nhấp vào nút tương ứng ở cuối bài viết.

Chào buổi chiều.

Chắc hẳn mỗi người trong chúng ta đều từng phải đối mặt với nhiệm vụ chuyển đổi một tài liệu giấy sang dạng điện tử. Điều này đặc biệt thường cần thiết đối với những người nghiên cứu, làm việc với tài liệu, dịch văn bản bằng từ điển điện tử, v.v.

Không phải ai cũng hiểu ngay một điều. Sau khi quét (lắp tất cả các tờ giấy vào máy scan), bạn sẽ có hình ảnh ở định dạng BMP, JPG, PNG, GIF (có thể có các định dạng khác). Vì vậy, bạn cần lấy văn bản từ hình ảnh này - quy trình này được gọi là nhận dạng. Sau đây sẽ được trình bày theo thứ tự này.

1. Cần những gì để quét và nhận dạng?

1) Máy quét

Để chuyển đổi tài liệu in thành dạng văn bản, trước tiên bạn cần có một máy quét và theo đó là các chương trình và trình điều khiển “gốc” đi kèm với nó. Sử dụng chúng, bạn có thể quét tài liệu và lưu nó để xử lý tiếp.

Bạn có thể sử dụng các phần mềm tương tự khác, nhưng phần mềm đi kèm với máy quét thường hoạt động nhanh hơn và có nhiều tùy chọn hơn.

Tùy thuộc vào loại máy quét bạn có, tốc độ hoạt động có thể thay đổi đáng kể. Có những máy quét có thể nhận hình ảnh từ một tờ giấy trong 10 giây và những máy quét khác sẽ nhận được hình ảnh đó sau 30 giây. Nếu scan một cuốn sách 200-300 tờ, tôi nghĩ không khó để tính ra chênh lệch múi giờ sẽ là bao nhiêu lần?

2) Chương trình công nhận

Trong bài viết của chúng tôi, tôi sẽ hướng dẫn bạn cách làm việc với một trong những chương trình tốt nhất để quét và nhận dạng hoàn toàn mọi tài liệu - ABBYY FineReader. Bởi vì Chương trình được trả phí, sau đó tôi sẽ ngay lập tức cung cấp cho bạn một liên kết đến một chương trình khác - tương tự miễn phí của nó. Đúng, tôi sẽ không so sánh chúng, vì FineReader thắng về mọi mặt, tôi vẫn khuyên bạn nên dùng thử.

ABBYY FineReader 11

Một trong những chương trình tốt nhất của loại hình này. Nó được thiết kế để nhận dạng văn bản trong hình ảnh. Nhiều tùy chọn và chức năng được tích hợp sẵn. Nó có thể phân tích một loạt phông chữ, thậm chí hỗ trợ các phiên bản viết tay (mặc dù cá nhân tôi chưa thử nhưng tôi nghĩ nó khó có thể nhận dạng tốt phiên bản viết tay trừ khi bạn có chữ viết thư pháp hoàn hảo). Làm việc với nó sẽ được mô tả chi tiết hơn dưới đây. Ở đây chúng tôi lưu ý rằng bài viết sẽ nói về cách làm việc trong phiên bản 11 của chương trình.

Theo quy định, các phiên bản khác nhau của ABBYY FineReader không khác nhau nhiều. Bạn có thể dễ dàng làm điều tương tự ở nơi khác. Sự khác biệt chính có thể nằm ở sự tiện lợi, tốc độ của chương trình và khả năng của nó. Ví dụ: các phiên bản trước từ chối mở tài liệu PDF và DJVU...

3) Tài liệu cần quét

Vâng, cứ như thế, tôi quyết định xếp tài liệu vào một cột riêng. Trong hầu hết các trường hợp, họ quét một số sách giáo khoa, báo, bài báo, tạp chí, v.v. những cuốn sách và văn học đang có nhu cầu. Tôi đang dẫn đầu với điều này ở đâu? Từ kinh nghiệm cá nhân, tôi có thể nói rằng phần lớn những gì bạn muốn quét có thể đã có trên Internet! Cá nhân tôi đã tiết kiệm thời gian bao nhiêu lần khi tìm thấy một cuốn sách cụ thể đã được quét trực tuyến. Tất cả những gì tôi phải làm là sao chép văn bản vào tài liệu và tiếp tục làm việc với nó.

Đây là một lời khuyên đơn giản - trước khi bạn quét thứ gì đó, hãy kiểm tra xem ai đó đã quét nó chưa và bạn không cần phải lãng phí thời gian của mình.

2. Tùy chọn quét văn bản

Ở đây tôi sẽ không nói về trình điều khiển của bạn cho máy quét, các chương trình đi kèm với nó, bởi vì tất cả các kiểu máy quét đều khác nhau, phần mềm cũng khác nhau ở mọi nơi và việc đoán là không thực tế chứ đừng nói đến việc chỉ ra rõ ràng cách thực hiện thao tác.

Nhưng tất cả các máy quét đều có cài đặt giống nhau, điều này có thể ảnh hưởng lớn đến tốc độ và chất lượng công việc của bạn. Đó chính xác là những gì chúng ta sẽ nói ở đây. Tôi sẽ liệt kê chúng theo thứ tự.

1) Chất lượng quét -DPI

Đầu tiên, đặt chất lượng quét trong các tùy chọn ở mức tối thiểu 300 dpi. Đó là khuyến khích để thiết lập nhiều hơn, nếu có thể. Độ phân giải càng cao, hình ảnh của bạn sẽ càng rõ ràng và do đó, quá trình xử lý tiếp theo sẽ diễn ra nhanh hơn. Ngoài ra, chất lượng quét càng cao thì sau này bạn càng phải sửa ít lỗi hơn.

Tùy chọn tối ưu thường cung cấp 300-400 dpi.

2) Màu sắc

Thông số này ảnh hưởng rất nhiều đến thời gian quét (nhân tiện, DPI cũng ảnh hưởng đến nó, nhưng chỉ ở mức độ nhất định và chỉ khi người dùng đặt giá trị cao).

Thông thường có ba chế độ:

Đen và trắng (tuyệt vời cho văn bản đơn giản);

Màu xám (thích hợp cho văn bản có bảng và hình ảnh);

Màu sắc (đối với tạp chí màu, sách, nói chung, các tài liệu mà màu sắc là quan trọng).

Thông thường, thời gian quét phụ thuộc vào việc lựa chọn màu sắc. Rốt cuộc, nếu tài liệu của bạn lớn, thì thậm chí thêm 5-10 giây trên toàn bộ trang cũng sẽ mang lại thời gian kha khá...

3) Ảnh

Bạn có thể nhận tài liệu không chỉ bằng cách quét mà còn bằng cách chụp ảnh nó. Theo quy luật, trong trường hợp này bạn sẽ gặp một số vấn đề khác: hình ảnh bị biến dạng, mờ. Do đó, có thể cần phải chỉnh sửa và xử lý thêm văn bản kết quả lâu hơn. Cá nhân tôi không khuyên bạn nên sử dụng máy ảnh cho vấn đề này.

Điều quan trọng cần lưu ý là không phải mọi tài liệu như vậy đều có thể được công nhận, bởi vì chất lượng quét của nó có thể cực kỳ thấp...

3. Nhận dạng văn bản tài liệu

Sau khi mở hình ảnh trong ABBYY FineReader, chương trình, theo quy luật, sẽ tự động bắt đầu đánh dấu các vùng và nhận dạng chúng. Nhưng đôi khi cô ấy làm không đúng. Với mục đích này, chúng tôi sẽ xem xét việc chọn các khu vực cần thiết theo cách thủ công.

Quan trọng! Không phải ai cũng hiểu ngay rằng sau khi mở một tài liệu trong chương trình, tài liệu gốc sẽ hiển thị ở bên trái trong cửa sổ, trong đó bạn chọn nhiều khu vực khác nhau. Sau khi nhấp vào nút “nhận dạng”, chương trình sẽ hiển thị văn bản hoàn chỉnh trong cửa sổ bên phải. Nhân tiện, sau khi nhận dạng, bạn nên kiểm tra lỗi văn bản trong cùng một FineReader.

3.1 Văn bản

Khu vực này được sử dụng để làm nổi bật văn bản. Hình ảnh và bảng biểu nên được loại trừ khỏi nó. Những phông chữ hiếm và lạ sẽ phải nhập thủ công...

Để đánh dấu vùng văn bản, hãy nhìn vào thanh ở đầu FineReader. Có nút “T” (xem ảnh chụp màn hình bên dưới, con trỏ chuột ở ngay nút này). Nhấp vào nó, sau đó trong hình bên dưới, chọn một vùng hình chữ nhật gọn gàng nơi chứa văn bản. Nhân tiện, trong một số trường hợp, bạn cần tạo các khối văn bản gồm 2-3 và đôi khi là 10-12 mỗi trang, bởi vì... Định dạng văn bản có thể khác nhau và một hình chữ nhật không thể làm nổi bật toàn bộ khu vực.

Điều quan trọng cần lưu ý là không nên đưa hình ảnh vào vùng văn bản! Điều này sẽ giúp bạn tiết kiệm rất nhiều thời gian sau này...

3.2 Hình ảnh

Được sử dụng để làm nổi bật hình ảnh và những vùng khó nhận biết do chất lượng kém hoặc phông chữ khác thường.

Trong ảnh chụp màn hình bên dưới, con trỏ chuột nằm trên nút dùng để đánh dấu vùng “hình ảnh”. Nhân tiện, bạn có thể chọn hoàn toàn bất kỳ phần nào của trang trong khu vực này và FineReader sau đó sẽ chèn phần đó vào tài liệu dưới dạng ảnh thông thường. Những thứ kia. chỉ là những bản sao “ngu ngốc”...

Thông thường, khu vực này được sử dụng để làm nổi bật các bảng được quét kém, để làm nổi bật văn bản và phông chữ không chuẩn và thậm chí cả hình ảnh.

3.3 Bàn

Ảnh chụp màn hình bên dưới hiển thị một nút để đánh dấu các bảng. Nói chung, cá nhân tôi rất hiếm khi sử dụng nó. Vấn đề là bạn sẽ phải thường xuyên vẽ (hầu như) mọi dòng trên bàn và chỉ ra chương trình là gì và như thế nào. Nếu bàn nhỏ và chất lượng không tốt, tôi khuyên bạn nên sử dụng khu vực “hình ảnh” cho những mục đích này. Điều này sẽ giúp bạn tiết kiệm rất nhiều thời gian và sau đó bạn có thể nhanh chóng tạo bảng trong Word dựa trên hình ảnh.

3.4 Các yếu tố không cần thiết

Điều quan trọng cần lưu ý. Đôi khi có những thành phần không cần thiết trên trang làm cản trở việc nhận dạng văn bản hoặc thậm chí ngăn bạn chọn vùng mong muốn. Chúng có thể được loại bỏ hoàn toàn bằng cách sử dụng một cục tẩy.

Để thực hiện việc này, hãy chuyển đến chế độ chỉnh sửa hình ảnh.

Chọn công cụ tẩy và chọn vùng không cần thiết. Nó sẽ bị xóa và thay vào đó là một tờ giấy trắng.

Nhân tiện, tôi khuyên bạn nên sử dụng tùy chọn này thường xuyên nhất có thể. Cố gắng xóa tất cả các vùng văn bản mà bạn đã chọn, nơi bạn không cần một đoạn văn bản hoặc có bất kỳ dấu chấm, vết mờ, biến dạng không cần thiết nào bằng cục tẩy. Nhờ đó, việc nhận dạng sẽ nhanh hơn!

4. Nhận dạng tệp PDF/DJVU

Nói chung, định dạng nhận dạng này sẽ không khác biệt so với các định dạng khác - tức là. Bạn có thể làm việc với nó theo cách tương tự như với hình ảnh. Điều duy nhất là chương trình không được là phiên bản quá cũ; nếu tệp PDF/DJVU không mở được cho bạn, hãy cập nhật phiên bản lên 11.

Một lời khuyên nhỏ. Sau khi mở tài liệu trong FineReader, nó sẽ tự động bắt đầu nhận dạng tài liệu. Thông thường trong các tệp PDF/DJVU, một vùng nhất định của trang không cần thiết trong toàn bộ tài liệu! Để xóa khu vực như vậy trên tất cả các trang, hãy làm như sau:

1. Vào phần chỉnh sửa hình ảnh.

2. Bật tùy chọn "cắt".

3. Chọn khu vực bạn cần trên tất cả các trang.

4. Nhấp vào áp dụng cho tất cả các trang và cắt.

5. Kiểm tra lỗi và lưu kết quả công việc

Có vẻ như, những vấn đề nào khác có thể xảy ra khi tất cả các khu vực đều được đánh dấu, sau đó được nhận dạng - hãy lấy nó và lưu nó... Nhưng thực tế không phải vậy!

Đầu tiên, bạn cần kiểm tra tài liệu!

Để kích hoạt nó, sau khi nhận dạng, sẽ có nút “kiểm tra” trong cửa sổ bên phải, xem ảnh chụp màn hình bên dưới. Sau khi nhấp vào nó, chương trình FineReader sẽ tự động hiển thị cho bạn những khu vực mà chương trình gặp lỗi và không thể xác định một ký tự cụ thể một cách đáng tin cậy. Tất cả những gì bạn phải làm là chọn, bạn đồng ý với ý kiến ​​​​của chương trình hoặc nhập biểu tượng của riêng bạn.

Nhân tiện, trong khoảng một nửa số trường hợp, chương trình sẽ cung cấp cho bạn một từ đúng được tạo sẵn - tất cả những gì bạn phải làm là dùng chuột chọn tùy chọn mong muốn.

Thứ hai, sau khi kiểm tra, bạn cần chọn định dạng mà bạn sẽ lưu kết quả công việc của mình.

Ở đây FineReader cho phép bạn khai thác tối đa: bạn có thể chỉ cần chuyển thông tin sang Word từng cái một hoặc bạn có thể lưu thông tin đó ở một trong hàng chục định dạng. Nhưng tôi muốn nhấn mạnh một khía cạnh quan trọng khác. Dù bạn chọn định dạng nào, điều quan trọng hơn là chọn loại bản sao! Hãy xem xét các lựa chọn thú vị nhất...

Bản sao chính xác

Tất cả các vùng bạn đã chọn trên trang trong tài liệu được nhận dạng sẽ tương ứng chính xác với tài liệu gốc. Một lựa chọn rất tiện lợi khi điều quan trọng là bạn không bị mất định dạng văn bản. Nhân tiện, phông chữ cũng sẽ rất giống với bản gốc. Với tùy chọn này, tôi khuyên bạn nên chuyển tài liệu sang Word để tiếp tục làm việc ở đó.

Bản sao có thể chỉnh sửa

Tùy chọn này tốt vì bạn sẽ nhận được phiên bản văn bản đã được định dạng sẵn. Những thứ kia. Bạn sẽ không tìm thấy những vết lõm có “kilômét” có thể có trong tài liệu gốc. Một lựa chọn hữu ích khi bạn sẽ chỉnh sửa thông tin đáng kể.

Đúng, bạn không nên chọn liệu việc giữ nguyên phong cách thiết kế, phông chữ và mức thụt lề có quan trọng đối với bạn hay không. Đôi khi, nếu khả năng nhận dạng không thành công, tài liệu của bạn có thể bị “lệch” do định dạng đã thay đổi. Trong trường hợp này, nên chọn một bản sao chính xác.

văn bản đơn giản

Một lựa chọn dành cho những người chỉ cần văn bản từ trang mà không cần mọi thứ khác. Thích hợp cho các tài liệu không có hình ảnh và bảng biểu.

Điều này kết thúc bài viết về quét và nhận dạng tài liệu. Tôi hy vọng rằng với những mẹo đơn giản này, bạn có thể giải quyết được vấn đề của mình...

Phần mềm OCR cho phép bạn chuyển đổi các tài liệu được chụp hoặc quét trực tiếp thành câu.

Thực tế là văn bản trong hình ảnh được trình bày dưới dạng raster, một tập hợp các dấu chấm. Phần mềm được đề cập sẽ chuyển đổi một tập hợp dấu chấm thành văn bản đầy đủ, có sẵn để chỉnh sửa và lưu.

Nhận dạng chữ cái được thiết kế để tối ưu hóa quá trình số hóa sách và tài liệu in hoặc viết tay.

Phương pháp số hóa này nhanh hơn nhiều so với tốc độ nhập thủ công từ hình ảnh. Được sử dụng rộng rãi trong việc số hóa các thư viện và cơ quan lưu trữ. Tiếp theo, chúng tôi sẽ xem xét năm đại diện tốt nhất của dòng chương trình tương tự.

ABBYY FineReader 10

FineReader là chương trình dẫn đầu không thể tranh cãi trong số tất cả các chương trình nhận dạng văn bản trong hình ảnh. Đặc biệt, không có phần mềm nào xử lý bảng chữ cái Cyrillic rõ ràng hơn. Nhìn chung, FineReader có 179 ngôn ngữ, văn bản được nhận dạng cực kỳ thành công.

Điều duy nhất có thể khiến người dùng thất vọng là chương trình phải trả phí. Chỉ có phiên bản dùng thử 15 ngày miễn phí. Trong thời gian này, được phép quét 50 trang.

Sau đó bạn sẽ phải trả tiền để sử dụng chương trình. FineReader dễ dàng “ăn” bất kỳ hình ảnh nào có chất lượng cao ít nhiều. Nguồn hoàn toàn không quan trọng. Có thể là một bức ảnh, bản quét một trang hoặc bất kỳ hình ảnh nào có chữ cái.

Thuận lợi:

  • nhận dạng chính xác;
  • một số lượng lớn các ngôn ngữ đọc;
  • chấp nhận chất lượng của hình ảnh nguồn.

Lỗ hổng:

  • bản dùng thử trong 15 ngày.

OCR CuneiMẫu

Chương trình miễn phí để đọc thông tin văn bản từ hình ảnh. Độ chính xác nhận dạng thấp hơn nhiều so với chương trình đang được xem xét trước đó. Nhưng đối với một tiện ích miễn phí thì chức năng vẫn rất tuyệt vời.

Hấp dẫn! CuneiForm nhận dạng các khối văn bản, đồ họa và thậm chí cả các bảng khác nhau. Hơn nữa, ngay cả các bảng không có dòng cũng có thể được đọc.

Để đảm bảo độ chính xác, các từ điển đặc biệt được kết nối với quy trình nhận dạng, giúp bổ sung vốn từ vựng từ các tài liệu được quét.

Thuận lợi:

  • phân phối miễn phí;
  • sử dụng từ điển để kiểm tra tính chính xác của văn bản;
  • quét văn bản từ các bản sao chất lượng kém.

Sai sót:

  • độ chính xác tương đối thấp;
  • số lượng nhỏ ngôn ngữ được hỗ trợ.

WinScan2PDF

Đây thậm chí không phải là một chương trình chính thức mà là một tiện ích. Không cần cài đặt và tệp thực thi chỉ nặng vài kilobyte. Quá trình nhận dạng diễn ra cực kỳ nhanh chóng, mặc dù tài liệu thu được chỉ được lưu ở định dạng PDF.

Trên thực tế, toàn bộ quá trình được thực hiện bằng cách nhấn ba nút: chọn nguồn, đích và trên thực tế là khởi chạy chương trình.

Tiện ích này được thiết kế để xử lý hàng loạt nhanh chóng nhiều tệp. Để thuận tiện cho người dùng, gói ngôn ngữ giao diện lớn được cung cấp.

Thuận lợi:

  • tính di động;
  • công việc nhanh chóng;
  • dễ sử dụng.

Sai sót:

  • kích cỡ nhỏ nhất;
  • định dạng tập tin đầu ra duy nhất.

OCR đơn giản

Một chương trình nhỏ tuyệt vời để nhận dạng văn bản từ hình ảnh. Nó thậm chí còn hỗ trợ đọc bản thảo. Vấn đề là tiếng Nga không có trong gói ngôn ngữ giao diện cũng như không có trong danh sách các ngôn ngữ được hỗ trợ nhận dạng.

Tuy nhiên, nếu bạn cần quét tiếng Anh, tiếng Đan Mạch hoặc tiếng Pháp, thì bạn sẽ không tìm thấy tùy chọn miễn phí nào tốt hơn.

Trong phạm vi của nó, chương trình cung cấp giải mã phông chữ chính xác, loại bỏ nhiễu và trích xuất hình ảnh đồ họa. Ngoài ra, giao diện chương trình còn được tích hợp sẵn trình soạn thảo văn bản, gần giống với WordPad, giúp tăng đáng kể khả năng sử dụng của chương trình.

Thuận lợi:

  • nhận dạng văn bản chính xác;
  • soạn thảo văn bản thuận tiện;
  • loại bỏ nhiễu khỏi hình ảnh.

Sai sót:

  • hoàn toàn không có tiếng Nga.

OCR miễn phí

Chương trình cho phép bạn nhanh chóng trích xuất văn bản và đồ họa từ hình ảnh. Phần mềm hỗ trợ làm việc với nhiều máy quét mà không làm giảm hiệu suất. Văn bản được trích xuất có thể được lưu ở định dạng tài liệu văn bản hoặc tài liệu MS Office.

Ngoài ra, chức năng nhận dạng nhiều trang được cung cấp.

Freemore OCR được phân phối miễn phí tuy nhiên giao diện chỉ bằng tiếng Anh. Nhưng tình huống này không hề ảnh hưởng đến sự thoải mái khi sử dụng vì các điều khiển được tổ chức một cách trực quan.

Thuận lợi:

  • phân phối miễn phí;
  • khả năng làm việc với nhiều máy quét;
  • độ chính xác nhận dạng là khá.

sai sót

  • Thiếu ngôn ngữ tiếng Nga trong giao diện;
  • Sự cần thiết phải tải xuống gói ngôn ngữ tiếng Nga để được công nhận.

Nhận dạng văn bản là một tính năng rất thuận tiện. Bạn không còn cần phải gõ lại khối lượng lớn từ sách và bài báo. Đối với giáo viên, sinh viên và các nhà nghiên cứu, những ứng dụng phần mềm như vậy thực sự là một món quà. Hãy xem xét các ứng dụng khác nhau và xác định chương trình nhận dạng văn bản từ hình ảnh nào là tốt nhất.

Làm thế nào nó hoạt động

Nhận dạng văn bản quang học (OCR - Optical Character Comments) là khả năng chuyển đổi văn bản từ dạng đồ họa (photo, scan, pdf) sang định dạng thông thường. Văn bản chuyển đổi có thể được chỉnh sửa.
Bất kỳ hình ảnh raster nào cũng bao gồm các dấu chấm. Phần mềm nhận dạng nhận dạng các chữ cái trong ảnh và chuyển chúng thành văn bản. Cấu trúc của tài liệu được phân tích. Các khối văn bản được đánh dấu. Sau đó, các đường được vẽ, được chia thành các từ và sau đó thành các ký hiệu. Mỗi ký tự được so sánh với các mẫu. Sau đó, các giả thuyết được đưa ra về loại biểu tượng đó. Dựa trên chúng, phần mềm sẽ phân tích các tùy chọn khác nhau để chia dòng thành từ và chia từ thành ký tự. Số lượng các giả thuyết như vậy là rất lớn. Cuối cùng chương trình sẽ đưa ra quyết định và xuất văn bản.

Tổng quan về phần mềm

Thông thường, tất cả các ứng dụng có thể được chia thành ba loại:

  • Trả.
  • Miễn phí.
  • Dịch vụ trực tuyến.

Chúng ta hãy xem xét một số tùy chọn từ mỗi phần.

Chương trình trả phí và miễn phí

OCR CuneiMẫu

Phần mềm miễn phí để nhận dạng văn bản được quét, có thể tải xuống tại đây.

Ứng dụng này được phát triển vào năm 1993 bởi Cognitive Technologies. Một trong những tính năng chính của nó vào thời điểm đó là khả năng nhận dạng hỗn hợp tiếng Nga và tiếng Anh. Năm 2009, một nhánh đã được thêm vào cho phép nhận dạng hỗn hợp các ngôn ngữ khác. Sản phẩm phần mềm được cung cấp kèm theo máy scan và máy in đa chức năng của các hãng sản xuất hàng đầu: Hewlet-Pachard, Epson, Xerox,.. Phiên bản mới nhất được phát hành vào năm 2009.
Sau khi tải xuống và cài đặt, chúng tôi tiến hành nhận dạng văn bản. Hãy lấy bài viết này làm ví dụ.

Giao diện chương trình đơn giản, menu bằng tiếng Nga.


Nhấp vào biểu tượng thư mục và tải hình ảnh lên. Nhấn nút nhận dạng.


Kết quả không ấn tượng. Văn bản nhiều màu không được nhận dạng.


Mặc dù đã sử dụng nhiều từ điển khác nhau nhưng tiếng Anh cũng không được công nhận rộng rãi.


Nói chung, một bức ảnh lý tưởng có thể được dịch thành các ký hiệu, nhưng chất lượng của ảnh gốc càng thấp thì chất lượng của kết quả càng thấp.
Cần lưu ý rằng đây là chương trình quét văn bản Nga hóa duy nhất được tải xuống miễn phí một cách hợp pháp. Tốt nhất, tất cả những người khác đều có thời gian dùng thử miễn phí.

RiDoc

Chương trình nhận dạng văn bản từ ảnh hoặc từ máy quét có bản dùng thử miễn phí trong 30 ngày. Bạn có thể tải nó ở đây.

Ứng dụng này có chức năng tốt và giao diện dễ tiếp cận. Để tải hình ảnh, nhấp vào nút "Mở".


Tiếp theo là nút “Nhận dạng”.


Kết quả là chúng ta có được kết quả cuối cùng. Nó có thể được mở trong Word hoặc OpenOffice.


Đây là kết quả.


Cũng không lý tưởng, nhưng nhiều hơn so với trường hợp trước.
Bạn cũng có thể thêm hình mờ hoặc hợp nhất nhiều hình ảnh.

ĐọcIris

Sản phẩm phần mềm trả phí có bản dùng thử 100 trang hoặc 10 ngày. Bạn có thể tải xuống chương trình máy quét để nhận dạng văn bản từ trang web chính thức tại đây.

Nhà phát triển là công ty IRIS của Bỉ, được thành lập vào năm 1986. Chuyên môn chính là công nghệ và sản phẩm nhận dạng tài liệu thông minh.

Chương trình chuyển đổi hình ảnh, tệp PDF hoặc tài liệu được quét thành tệp văn bản hoàn toàn có thể chỉnh sửa. Trích xuất văn bản từ tài liệu của bạn trong khi vẫn giữ nguyên bố cục của tệp gốc. Có các tính năng sau:

  • chuyển đổi các tệp Word, Excel và PowerPoint thành các tệp PDF được lập chỉ mục;
  • chuyển đổi tài liệu bằng menu ngữ cảnh;
  • chỉ tiêu chất lượng hồ sơ nhập khẩu;
  • tự động phát hiện máy quét;
  • mô-đun điều chỉnh phối cảnh.

Giao diện chương trình được Nga hóa (được biểu thị trong quá trình cài đặt) và khá đơn giản.


Nhấp vào nút “Từ tệp” và chọn hình ảnh của chúng tôi. Chương trình tự động chia nó thành hai khối.


Để nhận dạng, hãy nhấp vào nút “Mở” và chỉ định đường dẫn cho hình ảnh. Định dạng được chỉ định trong dòng trên.


Kết quả vượt quá mọi mong đợi. Ngay cả phác thảo đã được bảo tồn.


Bạn có thể gửi tài liệu qua thư hoặc tới đám mây. Để thực hiện việc này, hãy nhấp vào danh sách ở trên và chọn. Theo mặc định, nó được lưu vào một tập tin.


Chương trình này có giá khoảng 6.000 rúp.

ABBYY FineReader

Chương trình nổi tiếng và được quảng bá nhiều nhất. Bạn có thể tải phiên bản dùng thử tại đây.

Chi phí phải trả là 6.990 rúp. Sự phát triển của Nga năm 1993 vẫn được coi là một trong những sự phát triển tốt nhất trên thế giới. Những đặc điểm chính:

  • Nhận biết bảng biểu, đồ thị, công thức toán học.
  • Xem và điều hướng pdf.
  • Tạo và chỉnh sửa trực tiếp pdf.
  • Làm việc với chữ ký số.
  • So sánh các tài liệu.
  • Thêm ý kiến.

Chương trình có nhiều tính năng. Giao diện được Nga hóa và có thể truy cập được.


Sau khi nhấp vào nút "Mở" và chọn ảnh, quá trình phân chia tự động thành các khối sẽ bắt đầu.


Để bắt đầu quá trình, nhấp vào nút thích hợp.


Tất cả những gì còn lại là chọn định dạng để lưu và chỉ định thư mục để lưu tài liệu.


Hãy mở kết quả. Như bạn có thể thấy, việc công nhận đã diễn ra hoàn hảo.


So sánh lại với ReadIris.


Tùy chọn đầu tiên (Finereader) được thực hiện hoàn hảo. Vì vậy, có lẽ, chúng tôi sẽ ưu ái cho chương trình này. Chúng có giá tương đương nhau nên sự chênh lệch 600-700 rúp không đóng vai trò đặc biệt.

Nhận dạng văn bản từ ảnh trực tuyến

IMTrực tuyến

Dịch vụ xử lý ảnh trực tuyến. Trang web cung cấp các công cụ:

  • Nén và thay đổi kích thước ảnh
  • Cắt tỉa, cắt xén
  • Xử lý siêu dữ liệu được nhúng
  • Các hiệu ứng
  • Cải tiến
  • Định nghĩa hình ảnh bảng màu
  • Lấy nền
  • Xác định tỷ lệ phần trăm tương tự, v.v.

Một trang web thuận tiện cung cấp nhiều khả năng xử lý hình ảnh. Giao diện đơn giản và rõ ràng.


Cung cấp hai chương trình. Hãy so sánh. Tải tập tin lên và nhấp vào OK.


Tiếp theo, nhấp vào liên kết.


Kết quả không đáng khích lệ.


Hãy thử chương trình thứ hai.


Cũng nghi ngờ.


Hãy thiết lập một ngôn ngữ bổ sung.


Hãy kiểm tra kết quả.

Tốt hơn một chút, nhưng vẫn chưa hoàn hảo.

img2txt

Chương trình nhận dạng văn bản từ ảnh trực tuyến không cho phép quét.

Trang web đã hoạt động từ năm 2014. Các nhà phát triển không có kế hoạch bất kỳ dịch vụ nào khác ngoài dịch vụ hiện tại.


Chọn tệp và nhấp vào "Tải lên". Sau đó nhấp vào “Bắt đầu nhận dạng”.

Kết quả cũng không hoàn hảo.

Chuyển đổi

Một cổng trả phí khá lớn nơi bạn có thể tận dụng các tính năng sau:

  • Chuyển đổi video, âm thanh, hình ảnh.
  • Chuyển đổi PDF sang Word, Excel, PowerPoint.
  • Tách PDF.
  • Nén PDF, PNG, v.v.

Nguyên lý hoạt động hoàn toàn giống nhau nhưng có nhiều cài đặt hơn. Hình ảnh có thể được kéo và thả.


Bạn có thể chỉ định một số ngôn ngữ và loại tài liệu nơi lưu kết quả.


Người dùng chưa đăng ký chỉ có quyền truy cập vào 10 trang để nhận dạng.
Sau khi nhấp vào hình ảnh xác thực, chọn "Chuyển đổi".


Nhấp vào tải xuống.


Kết quả vượt quá mọi mong đợi.


Hóa ra các dịch vụ trực tuyến đơn giản cũng có khả năng cung cấp khả năng nhận dạng chất lượng cao. Vì vậy Convertio được tuyên bố là người chiến thắng rõ ràng ở hạng mục này. Nhưng giống như bất kỳ sản phẩm tuyệt vời nào, nó đều có giá của nó.

Vì vậy, chúng tôi đã xem xét các công cụ OCR khác nhau. Hóa ra những thứ miễn phí có thể giúp ích, nhưng chất lượng vẫn không tương xứng. Vì vậy, nếu bạn liên tục cần chuyển đổi văn bản từ in sang điện tử, bạn sẽ phải bỏ ra một số tiền.

Có một ngày tuyệt vời!