Cách làm việc với chương trình Abbyy Finereader. Cách sử dụng ABBYY FineReader. Tính năng soạn thảo văn bản trong Abbyy Finereader

Lịch sử của Abbyy FineReader đã có hơn 20 năm. Công ty đã kỷ niệm năm 2013 bằng việc phát hành phiên bản đầy đủ (so với Express Edition từ 2009) Abbyy FineReader Pro cho Mac và vài tháng sau, vào tháng 2 năm 2014, người dùng Windows cũng nhận được “quà tặng” của họ - Abbyy FineReader 12 Chuyên nghiệp và Doanh nghiệp. Hãy để tôi nhắc bạn rằng phiên bản trước đó đã xuất hiện vào năm 2011 và hai năm rưỡi là một khoảng thời gian dài - hãy cùng tìm hiểu xem những thay đổi đó quan trọng như thế nào.

thông tin chung

Các yêu cầu hệ thống cho phiên bản mới không hề thay đổi. Nền tảng có thể là Windows hoặc Windows Server bắt đầu từ XP và 2003 tương ứng. Yêu cầu về phần cứng thậm chí còn khiêm tốn hơn trong thời hiện đại: bộ xử lý có dung lượng bất kỳ với tần số 1 GHz, RAM ít nhất 1 GB cộng với 512 MB cho mỗi lõi máy tính, v.v. Chỉ có nhu cầu về dung lượng ổ đĩa đã tăng lên phần nào - bây giờ là cài đặt yêu cầu 700 và 850 MB (cộng với 700 MB khác cho các tệp công việc).

Đương nhiên, chúng ta đang nói về những yêu cầu tối thiểu; Toàn bộ khả năng của Abbyy FineReader 12 Professional sẽ chỉ được tiết lộ trên các hệ thống tương đối hiện đại. Đặc biệt, hãy để tôi nhắc bạn rằng chương trình có thể song song hóa một cách hiệu quả việc xử lý các trang riêng lẻ, sử dụng tất cả các lõi bộ xử lý và tải gần như 100% bất kỳ bộ xử lý nào. Nhưng nó thực sự không hề tham lam khi nói đến RAM, thậm chí vẫn giữ nguyên 32-bit.

Quy trình cài đặt cũng không thay đổi: tối thiểu các câu hỏi và tùy chọn. Abbyy FineReader 12 Professional vẫn đi kèm với Abbyy Screenshot Reader, tính năng này chỉ hoạt động sau khi người dùng đăng ký.

Sau này, bạn cũng sẽ có quyền truy cập vào hỗ trợ kỹ thuật.

Ngay cả trên cơ sở thông tin khiêm tốn này, chúng ta có thể cho rằng đây là kết quả của quá trình tiến hóa. Theo đó, trong thời gian tới tôi sẽ tập trung mô tả những thay đổi so với phiên bản trước, có thể chia làm 2 nhóm chính: làm việc với chương trình (giao diện, công cụ phụ trợ, dễ sử dụng) và OCR (chất lượng và hiệu suất nhận dạng). chính nó).

Làm việc với chương trình

Abbyy FineReader 12 Professional cho thấy một số cải tiến trong giao diện người dùng. Điều này có thể nhận thấy ngay lập tức trong cửa sổ Tác vụ, cửa sổ này sẽ mở theo mặc định khi chương trình khởi động. Rõ ràng là nó bắt chước khái niệm về các ô xếp của Windows 8.x và được điều chỉnh để điều khiển bằng ngón tay, đặc biệt vì chương trình cũng hỗ trợ các cử chỉ cơ bản như cuộn và thu phóng. Trên thực tế, những thay đổi chỉ ảnh hưởng đến “mặt tiền” và chỉ một phần - bên cạnh các ô có các điều khiển thông thường và trong quá trình thiết lập bất kỳ kịch bản nào, bạn sẽ phải xử lý các hộp thoại tiêu chuẩn. Làm việc với chúng bằng ngón tay khá khó khăn, đặc biệt là trên màn hình 8-10 inch, màn hình đang trở nên phổ biến với máy tính bảng Windows.

Thực sự không khó để tưởng tượng rằng người dùng một chiếc máy tính bảng được trang bị máy ảnh như vậy có thể muốn nhanh chóng nhập một số tài liệu in “khi đang di chuyển”. Trong khi đó, toàn bộ lịch sử của Windows, bắt đầu từ phiên bản đầu tiên của Tablet PC, đã xác nhận sự vô nghĩa của việc điều chỉnh giao diện máy tính để bàn tiêu chuẩn để điều khiển bằng cảm ứng. Rõ ràng, với những mục đích này, sẽ đúng hơn nhiều nếu tạo ra một lớp vỏ đặc biệt tương ứng với tất cả các khẩu pháo Metro, nhưng sử dụng cùng một "động cơ". Một ví dụ về giải pháp như vậy là Internet Explorer từ Windows 8.x. Ngoài ra, Abbyy thậm chí còn có một số tồn đọng dưới dạng Abbyy FineReader Touch dành cho Windows 8, sử dụng dịch vụ đám mây của công ty.

Nếu chúng ta bỏ qua tính năng nhập bằng cảm ứng thì sẽ có nhiều thay đổi hơn trong lớp này - từ bản cập nhật khá được mong đợi của cửa sổ để mở/lưu tài liệu, trong số những thứ khác, cung cấp khả năng truy cập dễ dàng vào bộ lưu trữ đám mây (nếu hệ thống có tác nhân tương ứng và thư mục của nó), đến một số thứ quan trọng và hữu ích hơn.

Quá trình xử lý trang trong Abbyy FineReader 12 Professional hiện được thực hiện ở chế độ nền. Điều này ngụ ý sự vắng mặt của cửa sổ phương thức trước đó với trạng thái hoạt động (hiện vai trò này được thực hiện bởi thanh trạng thái ở cuối màn hình) và theo đó, khả năng truy cập vào giao diện. Do đó, người dùng có cơ hội làm việc với chương trình song song với quá trình nhận dạng (tất nhiên là nếu nó đủ dài), chẳng hạn như sao chép các đoạn văn bản nhận được hoặc thậm chí điều chỉnh bố cục trang - phần sau sẽ là xếp hàng và xử lý lại.

Không giống như phiên bản trước, tính năng này cũng không có tính năng lật trang trong quá trình nhận dạng hoặc khi tài liệu được tải lần đầu nếu tính năng nhận dạng tự động bị tắt. Trong Abbyy FineReader 12 Professional, tài liệu được tải và chia thành các trang gần như ngay lập tức và hình thu nhỏ của chúng chỉ được tạo khi bạn cuộn qua bảng điều khiển bên trái theo cách thủ công. Trong số những thứ khác, điều này giúp tiết kiệm tài nguyên máy tính, đặc biệt đáng chú ý trên các tài liệu lớn nhiều trang.

Những thay đổi còn lại trong lớp này không quá thú vị, mặc dù chúng có thể hữu ích trong một số trường hợp, vì vậy chúng ta sẽ nói ngắn gọn về chúng.

Nếu bạn không cần xử lý toàn bộ tài liệu mà chỉ trích dẫn từng đoạn riêng lẻ, thì bạn có thể tắt tất cả các thao tác tự động và chọn các đoạn cần thiết thuộc bất kỳ loại nào, sao chép ngay chúng vào bảng tạm - trong khi quá trình phân tích và nhận dạng sẽ được thực hiện nhanh chóng .

Để có được kết quả có cấu trúc đơn giản hơn bản gốc, bạn có thể tắt tính năng tạo lại đầu trang, chân trang và các thành phần bố cục khác. Điều này có thể hữu ích, chẳng hạn như khi chuẩn bị sách điện tử.

Tiếp tục về sách điện tử, Abbyy FineReader 12 Professional hỗ trợ định dạng EPUB 2.0.1 và 3.0.

Các tùy chọn chuyển đổi sang XLSX đã được mở rộng, ví dụ: giờ đây có thể xóa định dạng hoặc lưu hình ảnh.

Khi lưu tài liệu kết quả dưới dạng PDF bằng một lớp văn bản, giờ đây bạn có thể tận dụng công nghệ Quét chính xác mới của Abbyy, giúp làm mịn các ký tự trên hình ảnh trang gốc. Nhân tiện, nó chỉ khả dụng ở chế độ màu.

Hiệu quả từ công việc của cô ấy khá đáng chú ý, mặc dù không phải lúc nào cũng vậy, hãy nói là “học thuật”. Tuy nhiên, khả năng đọc của các ký tự khử răng cưa phải cao hơn trong mọi trường hợp, nhưng trong ví dụ này, bản gốc thực sự có chất lượng rất thấp.


OCR

Bây giờ chúng ta hãy xem những cải tiến nào đã xảy ra trong chính cơ chế nhận dạng.

Các nhà phát triển báo cáo giai đoạn tiếp theo trong việc cải tiến công nghệ ADRT, để tôi nhắc bạn, phân tích và tái tạo cấu trúc logic của tài liệu. Người ta tuyên bố rằng nó đã bắt đầu hoạt động chính xác hơn nhiều, đặc biệt là với các bảng, danh sách và sơ đồ. Chứng minh điều này bằng những ví dụ đầy đủ không phải là điều dễ dàng nhưng không phải là không thể. Ví dụ: đây là kết quả nhận dạng (với cài đặt mặc định) của cùng một trang trong Abbyy FineReader 11 Professional (ở trên) và Abbyy FineReader 12 Professional (bên dưới).


Phiên bản cũ chỉ chọn lọc và xử lý khối văn bản chính, có lẽ coi những thành phần còn lại là “rác” do chất lượng của bản gốc không cao. Ngược lại, cái mới đã xác định chính xác danh sách và cố gắng tạo lại nó. Tuy nhiên, kết quả không lý tưởng: thực tế là không phải tất cả các điểm đánh dấu đều được nhận dạng, một lần nữa, có thể được quy cho chất lượng của hình ảnh, nhưng rõ ràng là chương trình vẫn không hiểu rằng có nội dung phía trước nó, nếu không thì nó sẽ không hiểu các con số là các chữ cái. Tuy nhiên, sự tiến bộ là hiển nhiên và những tuyên bố như vậy có thể không được đưa ra với những bản gốc chất lượng cao hơn.

Và đây là cách xử lý bảng “ngầm” không có đường phân chia - Abbyy FineReader 11 Professional (ở trên) và Abbyy FineReader 12 Professional (bên dưới).


Có thể thấy rõ rằng phiên bản cũ, không giống như phiên bản mới, hoàn toàn không thấy cấu trúc bảng ở đây và bị giới hạn ở một tập hợp các khối văn bản không liên quan. Hãy dành thời gian nhấp vào hình ảnh và so sánh kết quả nhận dạng - Abbyy FineReader 12 Professional gần như lý tưởng.

Thật không may, điều này không phải lúc nào cũng xảy ra và trên các trang lân cận Abbyy FineReader 12 Professional đã hiển thị kết quả tương tự như Abbyy FineReader 11 Professional. Mặc dù ADRT lẽ ra phải theo dõi những “mũ” giống hệt nhau và hiểu rằng phía trước nó là một loại bàn chảy.

Nhưng vẫn có thể nhận thấy rõ ràng rằng các thuật toán cập nhật chú ý đến nhiều chi tiết hơn trước. Ví dụ: trong quá trình thử nghiệm Abbyy FineReader 12 Professional, thậm chí còn có nỗ lực diễn giải một hình ảnh với vị trí thông tin văn bản có trật tự dưới dạng bảng. Thông thường hơn, phiên bản mới cũng cố gắng tạo lại các sơ đồ và sơ đồ khác nhau dựa trên hình nền, thay vì từ các khối văn bản và đồ họa riêng lẻ.

Có một số tính năng mới khác được thiết kế để cải thiện chất lượng nhận dạng trong Abbyy FineReader 12 Professional. Như bạn đã biết, một trong những điều kiện tiên quyết cho điều này là chất lượng của bản gốc, đặc biệt nếu nó được lấy bằng máy ảnh chứ không phải máy quét. Đó là lý do vì sao FineReader đã từng giới thiệu các công cụ xử lý trước bản gốc. Trong phiên bản mới, danh sách của họ đã được mở rộng, cắt dọc theo các cạnh của trang, làm sáng và cân bằng độ sáng nền cũng như loại bỏ các thành phần màu đã được thêm vào. Cái sau có thể hữu ích, ví dụ, để xử lý các tài liệu có con dấu và tem. Ngoài ra, giờ đây người dùng có thể kết nối các phương pháp khác nhau một cách riêng lẻ.

Hỗ trợ ngôn ngữ cũng đã được cải thiện. Thứ nhất, bảng chữ cái tiếng Nga có dấu đã xuất hiện, thứ hai là chất lượng nhận dạng tiếng Trung, tiếng Nhật và tiếng Hàn (lên tới 20%), tiếng Ả Rập (lên tới 60%) và tiếng Do Thái (lên tới 10%) đã tăng lên. đã tuyên bố - điều này rõ ràng đã đạt được thông qua việc cải tiến và đào tạo bổ sung các bộ phân loại.

Và cuối cùng, một trong những câu hỏi nhức nhối nhất của nhiều độc giả: tốc độ của chương trình có tăng lên không? Không dễ để trả lời câu hỏi này một cách hợp lý, đặc biệt là với những con số - có quá nhiều ngôn ngữ, mỗi ngôn ngữ đều có những sắc thái riêng; sự đa dạng của bản gốc quá lớn; Có quá nhiều yếu tố chưa biết ảnh hưởng đến hoạt động của thuật toán. Vì vậy, ngay cả bản thân các nhà phát triển cũng khá kiềm chế khi nói về việc tăng hiệu suất của Abbyy FineReader 12 Professional thêm 10-15%.

Những con số như vậy thường thu được từ kết quả xử lý số lượng tài liệu khá lớn và theo đó, đại diện cho một cái gì đó giống như “nhiệt độ trung bình trong bệnh viện”. Vì vậy, sẽ rất hữu ích nếu nghiên cứu chi tiết hơn một số trường hợp đặc biệt minh họa, chẳng hạn như hai trường hợp sau:

  • được quét màu với độ phân giải 300 dpi 10 trang tập sách đủ màu ở định dạng A4. Chất lượng tốt, ngôn ngữ là tiếng Nga và tiếng Anh, bố cục phức tạp;
  • PDF với hình ảnh đồ họa 138 trang của cuốn sách chứa một số ít hình minh họa màu và đen trắng, một số bảng. Chất lượng thấp (rõ ràng bắt đầu từ việc in "mù" trong sách giấy), ngôn ngữ là tiếng Ukraina và tiếng Nga, bố cục đơn giản.

Cả hai tài liệu đều được nhận dạng ở chế độ màu và tài liệu thứ hai cũng được nhận dạng ở chế độ đen trắng, nhằm mô phỏng quá trình chuẩn bị sách điện tử. Tất cả các cài đặt mặc định đều được giữ nguyên, ngoại trừ bộ ngôn ngữ và theo đó là các chế độ vận hành. Một PC có bộ xử lý i5-3450 và bộ nhớ 8 GB đã được sử dụng làm nơi thử nghiệm. Kết quả được trình bày ở bảng sau:

Như bạn có thể thấy, đối với PDF, tốc độ tăng tốc thậm chí còn vượt quá 15% đã hứa - có lẽ đây chỉ là một trong những trường hợp đặc biệt rất phù hợp cho những tối ưu hóa mới nhất trong thuật toán nhận dạng. Cần lưu ý rằng các chương trình, nói chung, đã thực hiện khối lượng công việc khác nhau. Chỉ cần nhìn vào các hình minh họa ở trên để xử lý bảng - thật khó để nói phiên bản nào khó hơn.

Về số lượng lỗi, thực tế là như nhau đối với cả hai phiên bản, mặc dù có thể nhận thấy rằng đôi khi các đoạn và ký hiệu khác nhau gây ra nghi ngờ - rõ ràng đây là bằng chứng về việc đào tạo các thuật toán. Trong mọi trường hợp, phần lớn các ký tự được nhận dạng không chắc chắn đã được xác định chính xác tuyệt đối bằng cách sử dụng từ điển và các lỗi “tổng thể” (giải thích không chính xác các ký hiệu đặc biệt và trang trí, văn bản trên đồ họa, v.v.) đều trùng khớp. Vì vậy sự khác biệt có thể coi như biến mất hoàn toàn.

Một câu hỏi khác là, việc cải thiện năng suất như vậy có ý nghĩa như thế nào? Rõ ràng, nửa phút thu được trên 138 trang vẫn cần được kiểm tra và có thể sửa chữa là không có giá trị bao nhiêu. Nếu công việc như nhiệm vụ kiểm tra thỉnh thoảng được thực hiện thì bạn chắc chắn không phải lo lắng về hiệu suất. Vấn đề lại là vấn đề khác khi xử lý ngoại tuyến khối lượng lớn tài liệu có sẵn trong Abbyy FineReader 12 Corporate. Trong trường hợp này, việc tiết kiệm được 15% thời gian là khá đáng chú ý.

Bản tóm tắt

Mặc dù thực tế là Abbyy FineReader 12 Professional mới không hứa hẹn điều gì mang tính cách mạng, nhưng ít nhất một vài thay đổi trong nó cũng đáng được khen ngợi. Trước hết, đây là những cải tiến đối với công nghệ ADRT về mặt nhận dạng bảng, biểu đồ và cấu trúc logic chung của trang, trong một số trường hợp cho phép bạn nhận được kết quả tốt hơn hoàn toàn, cũng như chế độ xử lý nền, mở ra những cơ hội mới cho công việc tương tác với các tài liệu lớn.

Ngoài ra còn có nhiều thay đổi khác nhưng không đáng kể. Xu hướng hướng tới hỗ trợ điều khiển cảm ứng ngày nay chắc chắn là hợp lý, nhưng con đường được chọn là luẩn quẩn - khó có thể cung cấp thao tác thuận tiện như nhau bằng chuột và ngón tay trong một giao diện. Tuy nhiên, hiện tại, máy tính bảng Windows chỉ đang cố gắng thâm nhập thị trường và các nhà phát triển từ Abbyy vẫn còn thời gian.

Giá Abbyy FineReader 12 Professional:

  • phiên bản đóng hộp: 4990 RUR;
  • phiên bản tải xuống: 4.490 RUB;
  • cập nhật: 2690 chà.

Như thường lệ, câu trả lời cho câu hỏi “đổi phiên bản cũ sang phiên bản mới có đáng không?” tùy theo hoàn cảnh. Trong mọi trường hợp, cần lưu ý rằng vòng đời của FineReader khá dài và nếu bất kỳ cải tiến nào được mô tả đóng vai trò quan trọng đối với bạn, thì sau 2-3 năm, chi phí cập nhật chắc chắn sẽ được đền đáp - nếu không muốn nói là về mặt vật chất , thì về mặt đạo đức. Việc tự mình giải quyết câu hỏi này cuối cùng sẽ có ích.

Lần này tôi sẽ hướng dẫn bạn cách chuyển tài liệu giấy sang định dạng PDF điện tử, cũng như cách chuyển tài liệu giấy sang máy tính để thay đổi văn bản. Vì vậy, hãy bắt đầu.
Tôi có một tài liệu giấy trong tay.

QUÉT sang PDF

Nhiệm vụ: chuyển tài liệu này vào máy tính (dịch sang dạng điện tử). Hơn nữa, nó cần phải được thực hiện chính xác theo hình thức này để sau này không thể thay đổi được (nói đại khái là bạn cần chụp ảnh tài liệu). Sau đó, tài liệu điện tử này phải được gửi qua đường bưu điện đến địa chỉ email. Hơn nữa, khách hàng yêu cầu nó ở định dạng pdf.

Theo từng giai đoạn:
1) Tôi chuyển tài liệu qua máy quét
2) Tôi lưu bản in thu được ở định dạng pdf vào máy tính của mình
3) Tôi gửi tập tin đã nhận qua thư
Trong công việc của mình, tôi sử dụng 2 chương trình để giải quyết vấn đề này:
Foxit Phantom hoặc ABBYY FineReader. Để rõ ràng, tôi đính kèm ảnh chụp màn hình:
Trong Foxit Phantom, khi bật máy quét, bạn cần chọn FILE-CREATE PDF FROM SCANNER trong menu chính...
Quá trình quét sẽ diễn ra và bạn sẽ được nhắc lưu tệp. Chọn một vị trí, viết tên tập tin và lưu.

ABBYY FineReader có các nút lớn trên thanh công cụ. Một trong số đó được gọi là QUÉT sang PDF. Chúng tôi sử dụng nó.

Nếu bạn cần quét một tài liệu nhiều trang thì theo các giai đoạn:
1) Nhấn nút số 1 QUÉT

Chúng tôi nhận được một tài liệu được quét

Chúng ta cũng quét thêm một trang khác (nhấn nút số 1 QUÉT lần nữa).
2) Lưu dưới dạng PDF



Kết quả là chúng ta nhận được một tài liệu nhiều trang hoàn chỉnh ở dạng tệp PDF.

Bây giờ tập tin này có thể được gửi qua email.

NHẬN DẠNG VĂN BẢN

Công việc: chuyển đổi văn bản giấy sang dạng điện tử (sang máy tính)

Theo từng giai đoạn:
1) Quét (nút 1 QUÉT)

2) Nhận dạng (nút 2 NHẬN DẠNG TẤT CẢ)

Nhận dạng nên được hiểu là quá trình chuyển một bức ảnh (hình ảnh) thành văn bản (chữ cái, số, ký hiệu). Nếu bạn chụp ảnh một trang văn bản, thì sau khi nhận dạng 99% văn bản từ giấy, nó sẽ chuyển thành văn bản điện tử. Văn bản điện tử đã có thể được thay đổi (chỉnh sửa) trên máy tính theo cách bạn muốn.

3) Lưu vào trình soạn thảo văn bản (nút 4 Lưu)
Tôi khuyên bạn nên chọn CHUYỂN TẤT CẢ CÁC TRANG SANG MICROSOFT WORD

Chúng tôi nhận được

Tôi muốn chỉ ra những điểm quan trọng trong quá trình CÔNG NHẬN. Có những sắc thái khi làm việc.
Ngay sau khi công nhận, tôi khuyên bạn nên xem kết quả. Đặc biệt là trên các khối mà chương trình FineReader tạo ra.

Đây là những khu vực được đánh dấu bằng khung hình chữ nhật. Những khung này có nhiều màu sắc khác nhau. Nếu nó có màu đỏ thì khối này được nhận dạng là HÌNH ẢNH. Nếu nó màu đen thì TEXT. Khối có nhiều loại khác nhau. Loại khối có thể được tìm thấy bằng cách nhấp vào khối bằng nút chuột PHẢI và chọn THAY ĐỔI LOẠI KHỐI.

Một mẹo nhỏ: bạn có thể chọn một vùng tùy ý và gắn nhãn cho nó bằng bất kỳ loại khối nào. Ví dụ: hãy chọn phần văn bản khó được nhận dạng bằng nút chuột trái (nhấp, giữ và kéo, khung sẽ thay đổi kích thước).

Kết quả tài liệu trong Word sẽ có một khối văn bản và một khối hình ảnh. Hình ảnh khối sẽ có diện mạo hoàn toàn không thay đổi. Tôi sử dụng phương pháp này khi lưu tem, phông chữ không chuẩn, hình ảnh và ảnh chụp.

Tái bút: Kiến thức và khả năng làm việc với PDF, scan và nhận dạng tài liệu thường giúp ích rất nhiều trong công việc văn phòng. Kiến thức tiết kiệm thời gian của bạn!

Xin chào. Hôm nay tôi sẽ nói về cách sử dụng chương trình Abbyy FineReader để nhận dạng văn bản từ hình ảnh mà bạn có thể nhận được sau quá trình quét. Văn bản được quét của bạn sẽ hoàn toàn nằm trong tài liệu Microsoft Word và văn bản được nhận dạng này có thể được chỉnh sửa! Nhận dạng văn bản bằng Abbyy Finereader có thể hữu ích cho những người nghiên cứu, làm việc với văn bản và bản dịch. Thật không may, chương trình này được trả tiền. Tôi đã từng có cơ hội dùng thử một trong những phiên bản miễn phí của các chương trình tương tự, nhưng văn bản được quét rất tốt được nhận dạng một cách đơn giản khủng khiếp... Và nhận dạng văn bản trong Abbyy FineReader hóa ra có chất lượng rất cao! Bây giờ tôi sẽ hướng dẫn bạn cách sử dụng chương trình Abbyy FineReader để nhận dạng nhanh văn bản từ hình ảnh.

ABBYY FineReader có phiên bản dùng thử trong 30 ngày với khả năng nhận dạng lên tới 100 trang và lưu không quá 3 trang từ một tài liệu. Những thứ kia. Trong thời gian này, bạn có thể xem các khả năng của chương trình và đưa ra quyết định sáng suốt - liệu bạn có cần nó hay không, liệu nó có đáng mua hay không.

Cách cài đặt Abbyy FineReader!

Trước khi sử dụng Abbyy Finereader bạn cần cài đặt nó. Hãy xem quá trình cài đặt của chương trình này...

Đầu tiên, chọn ngôn ngữ chương trình. Nhấp vào "OK".

Chúng tôi chấp nhận các điều khoản của thỏa thuận cấp phép (nếu muốn, bạn có thể đọc thỏa thuận cấp phép nếu bạn quan tâm đến nội dung của nó). Bấm tiếp".

Tiếp theo, bạn phải chọn chế độ cài đặt. Ở chế độ bình thường, chương trình sẽ không hỏi bạn và sẽ cài đặt những gì được chỉ định trong chương trình theo mặc định, cụ thể là tất cả các thành phần: chính chương trình nhận dạng văn bản Abbyy Finereader, một thành phần dành cho các chương trình Microsoft Office và một thành phần dành cho Windows Explorer (cho phép bạn để nhanh chóng nhận dạng hình ảnh mà không cần mở chương trình riêng). Tôi khuyên bạn nên kiểm tra cài đặt tùy chỉnh để định cấu hình nó theo cách bạn cần. Hơn nữa, sẽ không mất tới 15 phút :) Dưới đây là thư mục nơi chương trình sẽ được cài đặt. Nên để lựa chọn mặc định để sau này không gặp vấn đề gì khi sử dụng chương trình. Bấm tiếp".

Các thành phần chương trình. Cửa sổ này sẽ xuất hiện nếu bạn chọn kiểu cài đặt “Tùy chỉnh”. Các thành phần giống như các ứng dụng phụ trợ cho một chương trình. Thành phần đầu tiên là “Tích hợp với các chương trình Microsoft Office và Windows Explorer”. Thành phần này sẽ được hiển thị trong menu Microsoft Office và nếu bạn nhấn chuột phải vào hình ảnh trên máy tính sẽ có mục có chương trình này. Đây là giao diện menu của bạn trong Microsoft Office sau khi thêm thành phần này.

Đây là những gì sẽ xảy ra nếu bạn nhấp chuột phải vào hình ảnh:

Những thứ kia. Một menu sẽ xuất hiện trong đó bạn có thể thực hiện nhận dạng văn bản nhanh chóng và gửi kết quả tới Word, Excel hoặc PDF.

Thành phần thứ hai sẽ cho phép bạn nhận dạng văn bản từ màn hình máy tính. Điều này có nghĩa là bạn có thể chụp ảnh màn hình và nhận dạng văn bản. Nếu bạn không muốn cài đặt một trong các thành phần này hoặc không muốn cài đặt cả hai, thì bạn cần nhấp vào mũi tên xuống và chọn “Thành phần này sẽ không khả dụng”. Sau đó, thành phần sẽ không được cài đặt. Tôi đã bỏ cả hai.

4 điểm tiếp theo. Điều đầu tiên có nghĩa là thông tin về cách bạn sử dụng chương trình Abbyy Finereader sẽ được chuyển đến nhà phát triển. Tôi khuyên bạn không nên chọn mục này để chương trình không một lần nữa lên mạng gửi thông tin về cách làm việc với nó. Hơn nữa, bạn không bao giờ biết những thông tin nào khác sẽ được gửi :) Điểm thứ 2 tạo lối tắt đến chương trình trên màn hình. Thứ 3 có nghĩa là chương trình sẽ khởi động khi máy tính được bật và thứ 4 sẽ kiểm tra các bản cập nhật chương trình. Tôi chỉ để lại cái thứ hai và để lại dấu tích bên cạnh. Chúng tôi đóng tất cả các ứng dụng Microsoft Office vì trình cài đặt yêu cầu nó và nhấp vào “Cài đặt”.

Bạn cần đợi vài phút để chương trình tải và nhấp vào “Tiếp theo”.

Thế là xong, quá trình cài đặt đã hoàn tất! Nhấp vào “Hoàn tất”.

Làm cách nào tôi có thể sử dụng Abbyy Finereader để nhận dạng văn bản từ hình ảnh được quét hoặc bất kỳ hình ảnh nào khác?

Hãy xem cách sử dụng chương trình. Ví dụ: bạn đã quét văn bản. Bây giờ, để nhận dạng văn bản trong Abbyy FineReader, hãy mở chương trình. Nhấp vào “Mở”.

Chọn hình ảnh chúng ta cần và nhấp vào mở.

Khi bạn mở tài liệu mong muốn, Abbyy Finereader sẽ bắt đầu nhận dạng văn bản. Tài liệu càng lớn thì thời gian nhận dạng sẽ càng lâu. Quá trình nhận dạng một trang có thể mất vài giây.

Sau khi văn bản được nhận dạng, tất cả những gì bạn phải làm là lưu kết quả vào tài liệu Microsoft Word để sau đó bạn có thể chỉnh sửa bất kỳ nội dung nào trong đó. Để thực hiện việc này, hãy nhấp vào nút “Lưu” trên thanh công cụ trên cùng, sau đó chọn thư mục mà tài liệu Word sẽ được lưu vào và dưới tên nào.

Nếu bạn có máy quét được kết nối với máy tính thì bạn có thể bắt đầu quét trực tiếp từ chương trình và sau đó tài liệu đã quét sẽ được nhận dạng ngay lập tức. Để thực hiện việc này, hãy nhấp vào nút “Quét” trên thanh công cụ trên cùng. Các bước tiếp theo sẽ phụ thuộc vào chương trình trình điều khiển cho máy in của bạn. Bạn chỉ cần làm theo hướng dẫn của trình hướng dẫn quét.

Như bạn có thể thấy, mọi thứ đều rất đơn giản và nhanh chóng. Bây giờ bạn đã biết cách sử dụng Abbyy FineReader để nhận dạng văn bản từ hình ảnh! Tôi hy vọng thông tin này sẽ giúp ích được nhiều người :) Chúc may mắn!

Abbyy Finereader là chương trình nhận dạng văn bản bằng hình ảnh. Nguồn hình ảnh thường là máy quét hoặc MFP. Bạn có thể quét trực tiếp từ cửa sổ ứng dụng và sau đó tự động chuyển đổi hình ảnh thành văn bản. Ngoài ra, Fine Reader có thể chuyển đổi hình ảnh nhận được từ máy quét sang định dạng PDF và FB2, rất hữu ích khi tạo sách và tài liệu điện tử để in tiếp theo.

Cách khắc phục sự cố: ABBYY Finereader không nhìn thấy máy quét.

Để Abbyy Finereader 14 (phiên bản mới nhất) hoạt động chính xác, máy tính của bạn phải đáp ứng các yêu cầu sau:

  • bộ xử lý có tần số từ 1 GHz trở lên và hỗ trợ bộ lệnh SSE2;
  • Hệ điều hành Windows 10, 8.1, 8, 7;
  • RAM từ 1 GB, khuyến nghị – 4 GB;
  • Thiết bị đầu vào hình ảnh tương thích TWAIN hoặc WIA;
  • Truy cập Internet để kích hoạt.

Nếu phần cứng của bạn không đáp ứng các yêu cầu này, chương trình có thể không hoạt động chính xác. Nhưng ngay cả khi tất cả các điều kiện đều được đáp ứng, Abbyy FineReader vẫn thường tạo ra nhiều lỗi quét khác nhau, chẳng hạn như:

  • Nguồn TWAIN không thể mở được;
  • tham số được chỉ định không chính xác;
  • lỗi phần mềm nội bộ;
  • lỗi khởi tạo nguồn.

Trong phần lớn các trường hợp, sự cố liên quan đến chính ứng dụng và cài đặt của nó. Nhưng đôi khi lỗi xảy ra sau khi cập nhật hệ thống hoặc sau khi kết nối thiết bị mới. Hãy xem các đề xuất phổ biến nhất về việc cần làm nếu ABBYY FineReader không nhìn thấy máy quét và hiển thị thông báo lỗi.

Sửa lỗi

Có một số lời khuyên chung để sửa hoạt động không chính xác:

  1. Cập nhật trình điều khiển phần cứng của bạn lên phiên bản mới nhất từ ​​trang web chính thức của nhà sản xuất.
  2. Kiểm tra quyền của người dùng hiện tại trong hệ thống, tăng cấp độ truy cập nếu cần thiết.
  3. Đôi khi việc cài đặt phiên bản cũ hơn của ứng dụng sẽ giúp ích, đặc biệt nếu bạn đang làm việc trên phần cứng cũ hơn.
  4. Kiểm tra xem hệ thống có nhìn thấy máy quét hay không. Nếu nó không hiển thị trong Trình quản lý thiết bị hoặc hiển thị với dấu chấm than màu vàng thì vấn đề là ở phần cứng chứ không phải phần mềm. Vui lòng tham khảo hướng dẫn của nhà sản xuất hoặc hỗ trợ kỹ thuật.
  5. Trang web chính thức của ABBYY có hỗ trợ kỹ thuật tốt https://www.abbyy.com/ru-ru/support. Bạn có thể đặt câu hỏi, mô tả chi tiết vấn đề cụ thể của mình và nhận được giải pháp chuyên nghiệp trực tiếp hoàn toàn miễn phí.

Loại bỏ lỗi “Tham số được chỉ định không chính xác”

Trong phiên bản mới nhất của ABBYY FineReader, lỗi này còn có thể được gọi là “Lỗi khởi tạo nguồn”. Khởi tạo là quá trình kết nối và nhận dạng thiết bị của hệ thống.

Nếu Fine Reader không nhìn thấy máy quét khi khởi chạy hộp thoại quét và gây ra các lỗi sau thì các hành động sau sẽ hữu ích:

  1. Khởi động lại FineReader.
  2. Chuyển đến menu “Công cụ”, chọn “Trình chỉnh sửa OCR”.
  3. Nhấp vào "Công cụ", sau đó nhấp vào "Cài đặt".
  4. Bật phần "Cơ bản".
  5. Đi tới “Chọn thiết bị thu nhận hình ảnh”, sau đó “Chọn thiết bị”.
  6. Bấm vào danh sách thả xuống của trình điều khiển có sẵn. Kiểm tra chức năng quét từng cái một từ danh sách. Nếu bạn thành công với bất kỳ trong số chúng, hãy sử dụng nó trong tương lai.

CHÚ Ý. Cũng có thể quá trình quét không thể thực hiện được với bất kỳ trình điều khiển có sẵn nào. Sau đó nhấp vào “Sử dụng giao diện máy quét”.

Nếu cách này không hiệu quả, bạn sẽ cần đến tiện ích TWAIN_32 Twacker. Bạn có thể tải xuống nó từ trang web chính thức của ABBYY tại ftp://ftp.abbyy.com/TechSupport/twack_32.zip.

Sau đó, hãy làm theo hướng dẫn:

  1. Thoát Fine Reader.
  2. Giải nén kho lưu trữ twack_32.zip vào bất kỳ thư mục nào.
  3. Nhấp đúp vào Twack_32.exe.
  4. Sau khi bắt đầu chương trình, hãy chuyển đến menu “Tệp”, sau đó “Thu thập”.
  5. Nhấp vào “Quét” trong hộp thoại mở ra.
  6. Nếu tài liệu được quét thành công, hãy mở menu Tệp và nhấp vào Chọn Nguồn.
  7. Trình điều khiển mà tiện ích đã quét thành công sẽ được hiển thị bằng màu xanh lam.
  8. Chọn cùng một tệp trình điều khiển trong trình đọc tệp.

Nếu thao tác này lại không thành công khi khởi chạy trong Abbyy Finereader thì có nghĩa là chương trình đã có vấn đề. Gửi yêu cầu tới bộ phận hỗ trợ kỹ thuật của ABBYY. Nếu 32 Twacker không thể thực thi lệnh “Quét” thì bản thân thiết bị hoặc trình điều khiển của thiết bị có thể không hoạt động chính xác. Liên hệ với bộ phận hỗ trợ kỹ thuật của nhà sản xuất máy quét.

Lỗi phần mềm nội bộ

Điều xảy ra là khi bắt đầu quét, ứng dụng báo “Lỗi phần mềm nội bộ, mã 142”. Nó thường liên quan đến việc xóa hoặc hỏng các tệp hệ thống chương trình. Để khắc phục và ngăn chặn sự tái diễn, hãy làm như sau:


Đôi khi Finreader có thể không nhìn thấy máy quét do hạn chế truy cập. Chạy chương trình với tư cách quản trị viên hoặc nâng cao quyền của người dùng hiện tại.

Điều này giải quyết vấn đề kết nối chương trình Fine Reader với máy quét. Đôi khi nguyên nhân là do xung đột driver hoặc không tương thích phần cứng. Và đôi khi quét không thành công do lỗi phần mềm nội bộ. Nếu bạn gặp phải vấn đề tương tự ở một trình đọc tốt, hãy để lại các mẹo và giải pháp trong phần bình luận.

Như vậy là chúng ta đã cài đặt FineReader trên máy tính của mình. Chúng tôi bật máy quét và số hóa một số tài liệu nhiều trang. Hãy gọi nó một cách có điều kiện là "Thỏa thuận".

Đặt trang đầu tiên của tài liệu lên kính máy quét và đóng nắp lại. Khởi chạy chương trình FineReader. Nhấp vào nút “Quét” hoặc nhấn tổ hợp “Ctrl + K”. Cửa sổ "Quét ABBYY FineReader" sẽ mở ra. Khi số hóa một trang văn bản thông thường được gõ bằng phông chữ 11-12 point, hãy để cài đặt mặc định trong cửa sổ và nhấp vào nút “Xem”.

Máy quét hoạt động và sau vài giây, chúng tôi thấy trang của mình trong cửa sổ xem. Tại đây chúng ta có thể thay đổi kích thước quét nếu cần thiết. Và sau đó nhấp vào nút "Quét".

FineReader bắt đầu quá trình nhận dạng văn bản và trong vòng một phút, hình ảnh trang sẽ mở ra trong cửa sổ chương trình. Phía bên phải của cửa sổ bây giờ được chia thành ba phần. Ở phần bên trái "Hình ảnh" chúng ta có thể chỉnh sửa hình ảnh. Bạn có thể đọc thêm về chỉnh sửa hình ảnh trong bài học: Scan sách. Ở phần bên phải "Văn bản", bạn có thể thực hiện các thay đổi đối với văn bản ngay lập tức - chỉnh sửa nội dung của trang ngay cả trước khi lưu nó. Điều này rất thuận tiện khi bạn cần, ví dụ, nhanh chóng thay đổi ngày tháng, chi tiết và họ trong tài liệu.

Biểu tượng của trang được nhận dạng sẽ xuất hiện ở phần bên trái của cửa sổ “Trang”:

Nếu bạn không cần chỉnh sửa bất cứ điều gì, hãy thay trang đầu tiên trên kính máy quét bằng trang thứ hai và lặp lại công nghệ. Sau khi điều chỉnh kích thước quét một lần trong cửa sổ "Quét ABBYY FineReader" ở chế độ "Xem trước" cho trang đầu tiên, bây giờ hãy nhấp ngay vào nút "Quét". Cài đặt cho trang đầu tiên sẽ được lưu và các trang tiếp theo sẽ được quét mà không cần xem trước. Vì vậy, chúng tôi quét tất cả các trang trong tài liệu của chúng tôi.

Chúng tôi đã hoàn tất và bây giờ, bằng cách nhấp vào từng biểu tượng, chúng tôi sẽ mở các trang, kiểm tra trình tự chính xác của chúng.

Sau đó, ở phần bên trái của cửa sổ “Trang”, chọn tất cả các biểu tượng bằng nút: “Chỉnh sửa – Chọn tất cả” hoặc bằng phím tắt: “Ctrl + A”. Sau đó, trong danh sách thả xuống bên cạnh nút “Lưu”, chọn lệnh: “Lưu dưới dạng tài liệu PDF”:


Bây giờ hãy nhấp vào nút đó và lưu tài liệu có tên “Thỏa thuận.pdf” trong thư mục “Thỏa thuận”:


Kết quả là chúng tôi nhận được một tài liệu văn bản nhiều trang ở định dạng pdf - phiên bản điện tử của tài liệu của chúng tôi với tên mã “Thỏa thuận”.

Vì vậy, chúng tôi số hóa tài liệu văn bản bằng FineReader.

Bằng cách thay đổi chế độ quét thành “màu” trong cửa sổ “Quét ABBYY FineReader”, chúng ta cũng có thể dễ dàng số hóa ảnh và ảnh màu.

Và bằng cách cài đặt trong menu ngữ cảnh, chẳng hạn như lệnh: “Lưu dưới dạng tài liệu Microsoft Word 2007”, chúng tôi sẽ chuyển dự án của mình thành một tài liệu Word nhiều trang có thể chỉnh sửa.

Nhìn chung, chương trình dễ hiểu, trực quan và có các mẹo bật lên ở mọi nơi.