Tin tức

Giải pháp tối ưu hoá “Big Data” với Abbyy FineReader Server

Tháng 4 7, 2022

Được thiết kế để chuyển đổi tài liệu khối lượng lớn, ABBYY FineReader Server tự động chuyển đổi các bộ sưu tập tài liệu lớn thành các

 

kho lưu trữ kỹ thuật số có thể tìm kiếm và truy cập được.

 

 

Cùng Số hoá tìm hiểu những thông tin quan trọng của bài viết: 

 

 

  1. Tầm quan trọng của Big Data với doanh nghiệp

 

     2. Các tính năng nổi bật của ABBYY FineReader Server 

 

     3. ABBYY FineReader Server hỗ trợ hoạt động xử lý Big Data như thế nào? 

 

 

1. Tầm quan trọng của Big Data với doanh nghiệp

 

 

 

Thuật ngữ Big Data (dữ liệu lớn) bao quát một khối lượng dữ liệu cấu trúc và phi cấu trúc khổng lồ và không thể đo đếm. Big Data có tính

 

chất đa dạng và phức tạp, chúng không thể quản lý bằng các phương pháp dữ liệu truyền thống. 

 

 

 

Cùng với AI (Artificial Intelligence) trí tuệ nhân tạo và IoT (Internet of Things) Internet kết nối vạn vật, Big Data là nhân tố quan trọng giúp

 

doanh nghiệp hiện thực quá con đường xây dựng doanh nghiệp 4.0. Với dữ liệu lớn, doanh nghiệp có thể ứng dụng và đưa ra các giải

 

pháp: tối ưu chi phí, tối ưu thời gian, phát triển sản phẩm mới và xử lý quy trình thông minh.

 

 

Hiệu quả ứng dụng của Big Data giúp doanh nghiệp giải quyết tốt một số tác vụ như: 

 

 

  • Xác định nguyên nhân gốc dẫn đến những thất bại

 

  • Thiết lập các chương trình khuyến mại phù hợp dựa trên thu thập thông tin và phân tích hành vi của khách hàng

 

  • Phòng ngừa và đưa ra giải pháp trong rủi ro kinh doanh

 

  • Bảo vệ trước sự xâm hại và phát hiện các hành vi gian lận gây ảnh hưởng đến doanh nghiệp, tổ chức

 

 

Xem thêm: Với Big Data, cơ hội thành công của doanh nghiệp trong bối cảnh công nghệ 4.0 sẽ trở nên khả thi hơn bao giờ hết. Cùng tìm

 

hiểu về Big Data một cách toàn diện và chi tiết.

 

 

 

2. Các tính năng nổi bật của ABBYY FineReader Server 

 

 

Phiên bản ABBYY FineReader Server được thiết lập dành riêng cho hoạt động dữ liệu phức tạp và yêu cầu khả năng phân quyền sử dụng

 

thông minh. Dưới đây là các tính năng nổi bật của phần mềm, giúp tối ưu hoá giải pháp doanh thu cho doanh nghiệp. 

 

 

2.1. OCR hỗ trợ bởi AI

 

 

 

Công nghệ AI-OCR cung cấp kết quả nhanh chóng, chính xác trong hơn 200 ngôn ngữ (bao gồm tiếng Châu Âu, tiếng Ả Rập, CJK,…). Việc

 

nhận diện chính xác cao ngôn ngữ tiếng Việt với tính năng học ngôn ngữ thông minh giúp đưa ra kết quả chuyển đổi ưu vượt hơn nhiều

 

phần mềm khác.  

 

 

 

2.2. Khả năng mở rộng khối lượng lớn 

 

 

Phần mềm cho phép thực hiện chuyển đổi khối lượng lớn tài liệu trong một khung thời gian ngắn. Đây là giải pháp số hoá tối ưu cho doanh

 

nghiệp, giúp dữ liệu được hệ thống một cách nhanh chóng và tinh gọn, góp phần tiết kiệm chi phí và thời gian.  

 

 

2.3. Công nghệ PDF linh hoạt

 

 

Phần mềm thực hiện nén các tệp PDF để giảm thiểu kích thước tệp và vẫn bảo toàn chất lượng. Ngoài ra, PDF / A (-1a, -1b, -2a, -2b, -2u,

 

-3a, -3b, -3u), PDF / E, PDF định dạng UA được hỗ trợ ổn định. Các chức năng như hỗ trợ chữ ký điện tử, watermarking và xóa siêu dữ liệu

 

đã được trang bị nhằm phục vụ thêm nhiều nhu cầu khác của người sử dụng. 

 

 

2.4. Nhiều định dạng được hỗ trợ

 

 

Một tính năng đặc biệt khác của ABBYY FineReader Server là việc tự động chuyển đổi từ PDF, JPEG, TIFF, Word, Excel, Văn bản

 

OpenDocument, PowerPoint, HTML và các định dạng khác. Công nghệ OCR làm việc hiệu quả trong việc nhận dạng ký tự và đảm bảo việc

 

chuyển đổi giữ nguyên cấu trúc của văn bản ban đầu. 

 

 

2.5. Tích hợp với SharePoint 

 

 

Khi ứng dụng phần mềm, doanh nghiệp sẽ thực hiện hoạt động tự động chuyển đổi tài liệu từ Thư viện SharePoint thành các tệp PDF có

 

thể tìm kiếm được một cách dễ dàng. Quy trình lưu trữ, truy cập và chia sẻ tài liệu thuận lợi hơn trong việc quản lý doanh nghiệp. 

 

 

2.6. Nhận dạng mã vạch

 

 

Bên cạnh đó, ABBYY FineReader Server được trang bị khả năng phát hiện với sự trợ giúp của AI và đọc mã vạch 1D và 2D để cho phép

 

tách tài liệu và (hoặc) bổ sung siêu dữ liệu. 

 

 

2.7. Nhận dạng phông chữ cổ 

 

 

Phiên bản mới nhất của ABBYY FineReader Server hỗ trợ chữ đen, Schwabacher, và hầu hết các phông chữ Gothic khác bằng tiếng Anh,

 

tiếng Đức, tiếng Pháp, Ý và Tây Ban Nha. Đây là những phông chữ cổ, khó định dạng và nhận biết. Đồng thời cũng là một bất cập lớn đối

 

với các phần mềm nhận dạng và chuyển đổi dữ liệu khác. 

 

 

2.8. Tích hợp vào các hệ thống hiện có

 

 

Phần mềm cho phép kết nối dễ dàng với các kho lưu trữ kỹ thuật số hoặc doanh nghiệp hệ thống quản lý nội dung thông qua vé XML, API

 

dựa trên COM và dịch vụ web API, bao gồm API REST. 

 

 

2.9. Báo cáo kiểm toán

 

 

Việc ứng dụng phần mềm giúp nhà quản lý có thể phân tích kho lưu trữ để xác định các loại tệp và số lượng tài liệu có thể tìm kiếm được,

 

không thể tìm kiếm được nhanh chóng và tiện lợi. Ngoài ra FineReader Server còn có khả năng xác định bản sao, tệp lớn và quá hạn. 

 

 

2.10. Một số tính năng khác

 

 

  • Tách tài liệu: Tự động tách các tài liệu dựa trên số trang, trang trống, trang mã vạch và các quy tắc theo tập lệnh

 

  • Các loại tài liệu và siêu dữ liệu: Tự động gán các loại tài liệu và phân bổ; cho phép tạo thủ công siêu dữ liệu nếu cần

 

  • Kiến trúc dựa trên máy chủ: Sử dụng tất cả các tài nguyên phần cứng có sẵn trong cách hiệu quả nhất có thể

 

Xem thêm: Với FineReader, ABBYY cung cấp 2 phiên bản là PDF và Server phục vụ cho 2 đối tượng người dùng khác nhau với mục đích

 

sử dụng khác nhau. Với ABBYY FineReader PDF, mọi thao tác chuyển đổi tài liệu từ văn bản cứng sang dữ liệu kỹ thuật số được thực hiện

 

dễ dàng. 

 

 

3. ABBYY FineReader Server hỗ trợ hoạt động xử lý Big Data như thế nào?

 

 

 

Với những tính năng trên, ABBYY FineReader Server hoàn toàn đáp ứng các tiêu chí cho một công cụ xử lý hiện đại phù hợp với dung

 

lượng dữ liệu khổng lồ như Big Data. Vậy phần mềm này hỗ trợ hoạt động xử lý Big Data như thế nào? 

 

 

 

3.1. Đầu vào tài liệu

 

 

 

FineReader Server nhận đầu vào tài liệu từ máy quét, thư mục mạng chia sẻ, email, và Microsoft SharePoint.

 

 

3.1.1. Quét

 

 

FineReader Server cung cấp giao diện Trạm quét dễ sử dụng, hỗ trợ quét tài liệu theo lô. Các công cụ cải thiện chất lượng tích hợp bao

 

gồm xem trước hình ảnh và cải tiến, thao tác thủ công. Người dùng có thể tận dụng các lệnh kịch bản, để tự động chia nhỏ các trang lớn

 

hoặc sắp xếp lại các trang sau khi quét hai mặt.

 

 

3.1.2. Nhập tài liệu

 

 

Máy chủ FineReader có thể tự động truy xuất hình ảnh đã quét trước đó từ tài liệu thư viện và tệp được gửi dưới dạng tệp đính kèm e-mail.

 

Hình ảnh tài liệu đã nhập sẽ được xử lý với mức độ ưu tiên tương ứng và theo tài nguyên máy tính hiện có.

 

 

  • Quét qua TWAIN, WIA, ISIS

 

  • Tích hợp với tất cả các máy quét mạng và MFP

 

  • Xem thư mục nóng (FTP hoặc mạng cục bộ)

 

  • Tự động xử lý các tệp đến trong các thư mục đã xác định

 

  • Thu thập thông tin chia sẻ mạng và thư viện SharePoint

 

  • Phát hiện các tệp mới được thêm vào và chuyển đổi thành các định dạng có thể tìm kiếm

 

  • Nhập liệu qua e-mail (Microsoft Exchange, POP3, IMAP)

 

  • Tích hợp với máy chủ fax và e-mail và xử lý tệp đính kèm hình ảnh

 

 

3.2. Xử lý văn bản

 

 

FineReader Server có khả năng xử lý hình ảnh tài liệu thông qua nhận dạng tự động và chuyển đổi tài liệu với khả năng xác minh và lập

 

chỉ mục tùy chọn.​ Tuy nhiên, các thao tác với dữ liệu của phần mềm được phân quyền chỉnh sửa và truy cập nhờ hiệu quả chính sách bảo

 

mật của FineReader Server. 

 

 

3.2.1. Nhận dạng tài liệu với sự hỗ trợ của OCR

 

 

Quy trình nhận dạng OCR của Máy chủ FineReader chạy tự động trên một máy trạm chuyên dụng, có tên là Trạm xử lý. Nhờ việc sử dụng

 

công nghệ OCR chính xác cao của ABBYY, FineReader Server hỗ trợ một loạt các chức năng để tăng độ nhận dạng chính xác, bao gồm:

 

 

  • Xử lý trước hình ảnh (ví dụ: tách các trang kép để quét sách hoặc xóa tiếng ồn xung quanh)

 

  • Định nghĩa kiểu in (văn bản bình thường, máy đánh chữ, ma trận điểm, OCR-A, OCR-B, MICR E13b, và Gothic)

 

  • Định nghĩa ngôn ngữ (tự động nhận dạng hơn 200 ngôn ngữ và văn bản lịch sử trong phông chữ cũ)

 

  • Khả năng bỏ qua các tệp trùng lặp, lớn và lỗi thời

 

 

3.2.2. Xác minh

 

 

Trong một số trường hợp (ví dụ như khi số hóa sách), các kết quả nhận dạng phải được xác minh. Giao diện Trạm xác minh của

 

FineReader Server cung cấp tính năng tùy chọn công cụ sửa kết quả trên tất cả các tài liệu hoặc chỉ trên các tài liệu có khả năng nhận

 

dạng chính xác không cao. 

 

 

3.2.3. Lập chỉ mục 

 

 

Trên thực tế, hoạt động lập chỉ mục tài liệu có thể thực hiện theo cách thức thủ công. Người dùng sử dụng giao diện Trạm lập chỉ mục hoặc

 

sử dụng các tập lệnh tự động. Sau đó, danh sách các trường chỉ mục có thể nhập giá trị sẽ xuất hiện và cho phép đồng bộ hoá với hệ thống

 

của bên thứ ba. 

 

 

3.3. Lắp ráp và xuất tài liệu

 

 

Với FineReader Server, các trang đã xử lý sẽ được tập hợp và hệ thống khoa học thành các tài liệu riêng lẻ. Tài liệu có thể được phân tách

 

theo ba cách khác nhau:

 

 

  • Sử dụng các trang giấy trắng hoặc các trang mã vạch làm dấu phân cách

 

  • Theo số trang cố định trên mỗi tài liệu

 

  • Theo một quy tắc nhất định 

 

Các tài liệu đã thiết lập ở các định dạng nhất định sẽ được chuyển đến các vị trí đầu ra được xác định trước. Chẳng hạn như thư mục

 

mạng, thư viện tài liệu SharePoint và địa chỉ e-mail. Hoặc chúng sẽ được chuyển đến các ứng dụng khác được kết nối qua API. 

 

 

 

Tập lệnh cũng có thể được áp dụng để định tuyến thông minh và gửi tài liệu đến hệ thống quản lý nội dung của doanh nghiệp dựa trên

 

thuộc tính tài liệu. Ưu điểm vượt trội của FineReader Server hỗ trợ nhiều định dạng đầu ra và cho phép tạo nhiều tệp đầu ra cùng một lúc.

 

 

 

FineReader Server có thể thu thập dữ liệu từ các thư viện riêng lẻ, nhận dạng ký tự dựa trên hình ảnh không thể tìm kiếm được và chuyển

 

đổi chúng thành các định dạng có thể tìm kiếm được. 

 

 

 

Với những thuộc tính hoạt động này, hoạt động phân tích và xử lý dữ liệu của ABBYY FineReader Server đã khắc phục được tối ưu cấu

 

trúc dữ liệu phức tạp của Big Data. Quy trình sắp xếp, phân tách và hệ thống dữ liệu giúp doanh nghiệp giải quyết được bài toán kinh điển

 

về xử lý dữ liệu lớn để hội nhập với bước tiến của thời đại chuyển đổi số, đồng thời hiện thực hóa chuyển đổi số doanh nghiệp. 

 

 

 

 

 

Trên đây, Số hoá đã cung cấp đầy đủ và chi tiết những thông tin cụ thể về vai trò của Big Data đối với sự phát triển của doanh nghiệp và

 

phần mềm ABBYY  FineReader Server giúp giải quyết tối ưu cấu trúc và dung lượng của Big Data. ABBYY còn cung cấp thêm nhiều sản

 

phẩm tối ưu khác, giúp hoạt động số hoá trở nên thuận tiện và nhanh chóng hơn. 

Facebook
Hỗ trợ
Zalo
+8424.60279474