Hệ thống an ninh có chức năng nhận dạng khuôn mặt: nguyên lý hoạt động, lắp đặt và lĩnh vực ứng dụng

Thị trường nhận dạng khuôn mặt toàn cầu sẽ phát triển từ 4,05 tỷ USD vào năm 2017 năm trước 7,76 tỷ USD vào năm 2022.

Hệ thống nhận dạng khuôn mặt hoạt động như thế nào?

Về nguyên tắc, hệ thống nhận dạng khuôn mặt có thể được mô tả là quá trình khớp các khuôn mặt được chụp bởi ống kính máy ảnh với cơ sở dữ liệu về các hình ảnh khuôn mặt tham chiếu được lưu trữ và xác định trước đó.
Dựa trên việc triển khai cấu trúc của hệ thống nhận dạng khuôn mặt, có thể phân biệt ba sơ đồ chung.

Phân tích luồng video trên máy chủ

Sơ đồ triển khai phổ biến nhất là camera IP truyền luồng video đến máy chủ; trên máy chủ, phần mềm chuyên dụng sẽ phân tích luồng video và so sánh hình ảnh khuôn mặt thu được từ luồng video với cơ sở dữ liệu về các khuôn mặt tham chiếu.

Nhược điểm của sơ đồ này là: tải mạng cao, chi phí máy chủ cao; ngay cả máy chủ mạnh nhất cũng có thể kết nối một số lượng camera IP hạn chế, tức là. hệ thống càng lớn thì càng có nhiều máy chủ.
Ưu điểm là khả năng sử dụng hệ thống giám sát video hiện có.

Phân tích luồng video trên camera IP

Trong trường hợp này, việc phân tích hình ảnh sẽ được thực hiện trên chính máy ảnh và siêu dữ liệu đã xử lý sẽ được chuyển đến máy chủ.

Nhược điểm - bạn cần những chiếc máy ảnh đặc biệt, số lượng lựa chọn hiện nay rất ít, giá thành máy ảnh cao hơn máy ảnh thông thường. Ngoài ra, trong các hệ thống của các nhà sản xuất khác nhau, vấn đề lưu trữ và kích thước cơ sở dữ liệu tham chiếu khuôn mặt được nhận dạng, cũng như các vấn đề về tương tác giữa phần mềm trên máy ảnh và phần mềm trên máy chủ sẽ được giải quyết khác nhau.
Ưu điểm - kết nối số lượng camera gần như không giới hạn với một máy chủ

Phân tích luồng video trên thiết bị kiểm soát truy cập

Không giống như hai sơ đồ đầu tiên sử dụng camera IP, trong trường hợp này, camera được tích hợp vào thiết bị kiểm soát truy cập, ngoài nhận dạng khuôn mặt, xuất hiện tự nhiên trên thiết bị, còn thực hiện các chức năng kiểm soát truy cập, thường thông qua cửa quay hoặc điện. khóa được cài đặt trên cửa. Cơ sở dữ liệu về các khuôn mặt tham chiếu được lưu trữ trên thiết bị và thường không ở dạng ảnh chụp.

Nhược điểm - theo quy định, tất cả các thiết bị như vậy đều được sản xuất để sử dụng trong nhà.
Ưu điểm - chi phí hệ thống thấp so với hệ thống giám sát video được sử dụng để nhận dạng khuôn mặt.

Trong mọi trường hợp, sự thành công của dự án nhận dạng khuôn mặt phụ thuộc vào ba yếu tố quan trọng:
Thuật toán nhận dạng
Cơ sở dữ liệu khuôn mặt được nhận dạng (tiêu chuẩn)
Hiệu suất thuật toán

Công nghệ nhận dạng khuôn mặt

Thông thường, hệ thống bao gồm một camera giám sát video và phần mềm thực hiện phân tích hình ảnh.Phần mềm nhận dạng khuôn mặt dựa trên việc xử lý hình ảnh và tính toán các thuật toán toán học phức tạp, đòi hỏi một máy chủ mạnh hơn mức thường được yêu cầu cho các hệ thống giám sát video.

Chúng ta sẽ quan tâm chủ yếu đến các chỉ số chất lượng của phần mềm. Thứ hai, cần có sức mạnh máy chủ nào để phân tích hình ảnh và xử lý cơ sở dữ liệu hình ảnh, và thứ ba, chúng tôi sẽ xem xét vấn đề về khả năng ứng dụng camera IP cho mục đích nhận dạng khuôn mặt.Cần đặc biệt chú ý đến những thiết bị được gọi là “độc lập” thực hiện xử lý hình ảnh trực tiếp trên chính thiết bị đó chứ không phải trên máy chủ; những thiết bị đó cũng có thể có cơ sở dữ liệu về các khuôn mặt tham chiếu được lưu trữ trong bộ nhớ.

Nhận dạng khuôn mặt 2D
Công nghệ nhận dạng khuôn mặt 2D (hai chiều) dựa trên hình ảnh hai chiều phẳng. Các thuật toán nhận dạng khuôn mặt sử dụng: thông số nhân trắc học khuôn mặt, biểu đồ - mô hình khuôn mặt hoặc mô hình khuôn mặt 2D đàn hồi, cũng như hình ảnh với khuôn mặt được biểu thị bằng một tập hợp các đặc điểm vật lý hoặc toán học nhất định. Chúng ta sẽ xem xét đánh giá mức độ phổ biến của các thuật toán nhận dạng khuôn mặt dưới đây.

Nhận dạng hình ảnh 2D là một trong những công nghệ phổ biến nhất hiện nay. Vì cơ sở dữ liệu chính của các cá nhân được xác định được tích lũy trên thế giới chính xác là hai chiều. Và thiết bị chính, đã được lắp đặt, cũng là 2D trên toàn thế giới - theo dữ liệu năm 2016 - 350 triệu camera quan sát. Đây là lý do tại sao nhu cầu chính là hệ thống nhận dạng khuôn mặt 2D.

Và nhu cầu, như chúng ta biết, sẽ kích thích nguồn cung, buộc các nhà phát triển phải nỗ lực tối đa để cải tiến công nghệ 2D.Những nỗ lực này đôi khi mang lại những kết quả thú vị không ngờ, chẳng hạn như việc tạo ra mô hình ba chiều của khuôn mặt dựa trên hình ảnh 2D.Các nhà nghiên cứu từ Đại học Nottingham và Kingston đã trình bày một dự án tái tạo khuôn mặt 3D dựa trên một hình ảnh duy nhất.Mạng lưới thần kinh, qua đó nhiều mô hình 3D ba chiều của con người và các bức chân dung thông thường được truyền qua, tái tạo khuôn mặt ba chiều của con người chỉ dựa trên một hình ảnh hai chiều của khuôn mặt.

Thuận lợi
Một lợi thế rất lớn của nhận dạng khuôn mặt 2D là sự sẵn có của cơ sở dữ liệu sẵn có về tiêu chuẩn khuôn mặt và cơ sở hạ tầng sẵn có. Nhu cầu tối đa sẽ nằm ở phân khúc này và nhu cầu sẽ kích thích các nhà phát triển cải tiến công nghệ.

sai sót
Tỷ lệ lỗi FAR và FRR cao hơn so với nhận dạng khuôn mặt 3D.

Nhận dạng khuôn mặt 3D
Nhận dạng 3D (Nhận dạng khuôn mặt ba chiều - tiếng Anh) thường được thực hiện bằng cách sử dụng hình ảnh ba chiều được tái tạo. Công nghệ nhận dạng khuôn mặt 3D có đặc tính chất lượng cao hơn. Mặc dù tất nhiên nó không lý tưởng.

Có một số công nghệ quét 3D khác nhau. Đây có thể là máy quét laser ước tính khoảng cách từ máy quét đến các phần tử trên bề mặt của vật thể, máy quét đặc biệt với khả năng chiếu sáng có cấu trúc trên bề mặt vật thể và xử lý toán học các dải uốn cong hoặc chúng có thể là máy quét xử lý các cặp hình ảnh khuôn mặt đồng bộ bằng cách sử dụng phương pháp đo ảnh.

Một trong những máy quét 3D được người tiêu dùng và chuyên gia nghiên cứu nhiều nhất là Face ID nổi tiếng của Apple. Trải nghiệm sử dụng Face ID cực kỳ thú vị và mang tính biểu tượng, vì trên thực tế đây là thiết bị duy nhất có công nghệ nhận dạng khuôn mặt 3D được tung ra thị trường đại chúng, tất nhiên, nếu bạn có thể coi một chiếc điện thoại một trăm đô la là một thiết bị dành cho đại chúng chợ.

Công nghệ 3D của Apple là công nghệ duy nhất trên thế giới sử dụng tia laser phát ra theo chiều dọc (VCSEL) và được đồn đại là đã chi tổng cộng 1,5 đến 2 tỷ USD cho việc phát triển Face ID. Nhà cung cấp VCSEL cho Apple là hai công ty Finisar Corp (Apple đầu tư - 390 triệu USD) và Lumentum Holdings. Và xét trên thực tế, các công nghệ 3D khác không phát huy được hiệu quả như Face ID nên tính năng mở khóa bằng khuôn mặt trên smartphone Android sẽ không sớm xuất hiện.

Đương nhiên, Face ID không thể đảm nhận nhiệm vụ xác định cặp song sinh, mặc dù không ai mong đợi điều này nhưng ngay cả những người thân cũng thất bại.
Chà, đúng là một khoảnh khắc hài hước, nhưng lúc đầu Face ID không phân biệt được người châu Á, nhưng vấn đề đã được khắc phục nhanh đến mức Apple thậm chí không có thời gian để đệ đơn kiện vì tội phân biệt chủng tộc.

Lợi ích của 3D
Độ chính xác cao hơn và ít lỗi hơn vẫn chưa thể đạt được đối với hệ thống nhận dạng khuôn mặt 2D.

Nhược điểm của 3D
Vừa đủ dễ giả mạo dành cho các chuyên gia
Ngay cả Face ID dù rất ngầu nhưng cũng bị công ty Bkav của Việt Nam hack ngay sau khi mở bán. Mặt nạ được tạo ra bằng máy in 3D. Chi phí tạo ra chiếc mặt nạ chỉ là 150 USD. Đối với người bình thường, việc làm một chiếc khẩu trang khá khó khăn và mẹ bạn khó có thể lặp lại được, nhưng đối với những người chuyên nghiệp thì việc đó giống như hai ngón tay đặt trên đường nhựa.

Không sử dụng nhận dạng khuôn mặt 3D để bảo vệ khỏi việc truy cập trái phép vào máy tính xách tay, điện thoại thông minh hoặc cơ sở có mức độ bí mật đặc biệt; tất cả chúng đều có thể dễ dàng bị các chuyên gia tấn công;

Yêu cầu nhận dạng 3D máy ảnh đặc biệtđể quét, mà đắt hơn gấp mấy lần camera quan sát thông thường được sử dụng trong nhận dạng 2D.
Thiếu cơ sở dữ liệu làm sẵn về khuôn mặt được nhận dạng so với nhận dạng 2D
Nhận dạng cặp song sinh vẫn là một nhiệm vụ đầy thách thức đối với các thuật toán nhận dạng khuôn mặt. Trung bình trên toàn thế giới có 13,1 cặp song sinh được sinh ra trên 1.000 ca sinh và con số này thay đổi rất nhiều tùy theo khu vực địa lý.

Nhận dạng khuôn mặt dựa trên kết cấu da mặt
Hình ảnh có độ phân giải cao là một yếu tố khác giúp cải tiến công nghệ nhận dạng khuôn mặt; nhờ độ phân giải cao mà việc phân tích rất chi tiết về kết cấu da đã trở nên khả thi.

Trong kiểu phân tích này, một vùng da mặt cụ thể có thể được ghi lại dưới dạng hình ảnh, sau đó được chia thành các đơn vị nhỏ hơn, được chuyển thành các không gian có thể đo lường bằng toán học, trong đó các đường nét, lỗ chân lông và kết cấu thực tế của da được ghi lại.

Công nghệ này có thể xác định sự khác biệt giữa các cặp song sinh, điều mà phần mềm nhận dạng khuôn mặt vẫn chưa thực hiện được.” Nếu nhận dạng khuôn mặt được kết hợp với phân tích kết cấu bề mặt, độ chính xác nhận dạng có thể tăng lên rất nhiều.

Nhận dạng khuôn mặt từ ảnh nhiệt
Việc sử dụng camera chụp ảnh nhiệt cho mục đích nhận dạng khuôn mặt hiện được coi là một lĩnh vực đầy hứa hẹn để phát triển, nhưng vẫn chưa có giải pháp thương mại nào sẵn sàng để triển khai.

Công nghệ này khá hứa hẹn vì nó cho phép chúng ta loại bỏ những điểm yếu của việc nhận dạng 2D.

Nhận dạng khuôn mặt trong bóng tối hoàn toàn và trong điều kiện ánh sáng yếu
Trang điểm, kiểu tóc, râu, mũ, kính không phải là vấn đề đối với máy ảnh nhiệt
Cho phép bạn nhận ra cặp song sinh

Có hai hướng phát triển đang được thực hiện:
Nhận dạng dựa trên biểu đồ nhiệt được tạo trước của các cá nhân được xác định. Các vấn đề ở đây cũng giống như với nhận dạng 3D, không có cơ sở dữ liệu tiêu chuẩn sẵn có và thiết bị đắt tiền.
Nhận dạng một người từ các hình ảnh thu được từ camera chụp ảnh nhiệt và cơ sở dữ liệu về hình ảnh hai chiều thông thường được sử dụng làm khuôn mặt tham chiếu. Vấn đề đã được giải quyết, như bạn có thể đã đoán, bằng cách sử dụng mạng lưới thần kinh sâu.

Nhận dạng khuôn mặt dựa trên kết cấu da và hình ảnh nhiệt. Nó chỉ hoạt động trong phòng thí nghiệm và thậm chí khi đó nó cũng không lý tưởng. Nhưng chúng tôi đang theo dõi chặt chẽ và nếu có điều gì xảy ra, chúng tôi sẽ thông báo cho bạn ngay lập tức.

Chất lượng phần mềm

Có một số số liệu quan trọng để đánh giá chất lượng phần mềm.

Quan trọng nhất trong số đó là FRR và FAR
Tỷ lệ từ chối sai - FRR (Tỷ lệ từ chối sai) - xác suất hệ thống không xác định hoặc xác minh tính xác thực của người dùng đã đăng ký.

FRR được tính như thế nào:
Gọi Nt là số lượng tiêu chuẩn hình ảnh trong cơ sở dữ liệu. FR - số lần không nhận dạng sai (Từ chối sai - Ivanov, không được công nhận là Ivanov),

Tỷ lệ chấp nhận sai - FAR (Tỷ lệ chấp nhận sai) - khả năng hệ thống nhận dạng khuôn mặt sẽ xác định sai một người dùng chưa đăng ký hoặc xác nhận tính xác thực của người đó.

FAR được tính như thế nào:
Gọi Nt là số lượng tiêu chuẩn hình ảnh trong cơ sở dữ liệu. FA - số lượng nhận dạng sai (Chấp nhận sai - Ivanov được công nhận là Petrov),

Điều đầu tiên và quan trọng nhất bạn cần biết về hai chỉ số này là chúng không mang tính tuyệt đối mà mang tính tương đối, tức là. chúng có thể khác nhau tùy thuộc vào cài đặt của thuật toán nhận dạng khuôn mặt.

Thứ hai là các chỉ số này có liên quan với nhau - FAR càng thấp thì FRR càng lớn.

Giá trị gần đúng của FRR và FAR cho hệ thống nhận dạng khuôn mặt và mối quan hệ của chúng được trình bày trong bảng:

So sánh FAR và FRR của các phương pháp nhận dạng sinh trắc học khác nhau:

Nhà phát triển thuật toán nhận dạng khuôn mặt

Theo quy định, thuật toán nhận dạng không phải là một sản phẩm phần mềm làm sẵn mà là một thuật toán phần mềm chưa được đóng gói thành sản phẩm phần mềm và phần cứng.

Trên thế giới có khá nhiều nhà sản xuất thuật toán nhận dạng, may mắn thay có những tổ chức độc lập kiểm tra tính hiệu quả của thuật toán. Nổi tiếng nhất: NIST - Viện Tiêu chuẩn Công nghệ Quốc gia Hoa Kỳ và MegaFace - Đại học Washington, Những khuôn mặt được dán nhãn trong tự nhiên, còn những cái khác. Kết quả của các cuộc thi được cập nhật liên tục. Bất kỳ công ty nào cũng có thể cập nhật kết quả của mình bất kỳ lúc nào bằng cách làm lại bài kiểm tra. Cách đây không lâu, NtechLab tuyên bố mình là người chiến thắng nhưng hôm nay họ chỉ đứng ở vị trí thứ 4.

Chúng tôi sẽ công bố kết quả thử nghiệm NIST kể từ ngày 13/5/2018. Vì NIST, theo quan điểm của tôi, thú vị hơn vì việc thử nghiệm các thuật toán diễn ra trên cơ sở dữ liệu đóng của các cá nhân, điều này giúp loại bỏ sự chuẩn bị của nhà phát triển cho việc thử nghiệm.

Thuật toán - megvii-000 từ Megvii, Trung Quốc
Công ty Trung Quốc Megvii với sản phẩm chính Face++. Quaước tính của KommersantDoanh thu của công ty đạt khoảng 100 triệu USD.
Thuật toán: Vị trí thứ 2 - Visionlabs-003, Vị trí thứ 7 - Visionlabs-002, VisionLabs, Nga
Thuật toán: Vị trí thứ 3 - morpho-002, vị trí thứ 17 - morpho-000. OT-Morpho, Pháp
Đối thủ nặng ký đầu tiên trong bảng xếp hạng với doanh thu gần 3 tỷ euro cho năm 2017. Liên doanh Oberthur Technologies (OT) và Safran Identity & Security (Morpho)
Thuật toán: Vị trí thứ 4 - ntechlab-003, vị trí thứ 13 - ntechlab-002 từ NtechLab, Nga
Công ty Moscow, nơi trở nên nổi tiếng với tư cách là nhà phát triểngiải pháp tìm diễn viên khiêu dâm .
Nhận đầu tư từ RT - Business Development (công ty con của Rostec) và quỹ VB Partners. Số tiền đầu tư không được tiết lộ. Kết quả là công ty con Rostec nhận được 12,5% cổ phần của công ty, quỹ đầu tư vốn biến đổi New Dimension Fund do VB Partners quản lý nhận được 25% cổ phần của công ty. NtechLab có kế hoạch thâm nhập thị trường hệ thống an ninh quốc gia và đẩy nhanh sự phát triển trong lĩnh vực thương mại.
Thuật toán - cogent-000 từ Gemalto Cogent, Hoa Kỳ
Phát triển đầy đủ các giải pháp sinh trắc học, tập trung vào thực thi pháp luật, kiểm soát biên giới và nhận dạng dân sự. Doanh thu toàn cầu hàng năm là khoảng 205 triệu USD.
Thuật toán - vocord-002 từ Vocord, Nga
Công ty Vocord được thành lập vào năm 1999 bởi các sinh viên tốt nghiệp MIPT là Dmitry Zavarikin và Alexey Kadeishvili. Theo SPARK-Interfax, năm 2014 doanh thu của công ty lên tới 302 triệu rúp; không thể lấy được dữ liệu gần đây hơn tại thời điểm viết bài.
Thuật toán: - fdu-000, vị trí thứ 9 - fdu-001.Đại học Phúc Đán, Trung Quốc
Thuật toán - công nghệ thần kinh-003. Công nghệ thần kinh, Litva
Từ trang web của công ty bạn có thể Tải xuống phiên bản demo của phần mềm dành cho PC và điện thoại thông minh Android, phiên bản demo của SDK. Công ty có một kênh YouTube cung cấp nhiều thông tin. Giá được công bố trên trang web. Công ty cũng cung cấp dịch vụ đám mây của riêng mình www.skybiometry.com
Thuật toán - itmo-003. Đại học Công nghệ Thông tin, Cơ học và Quang học Bang Saint Petersburg, Nga
Thuật toán - 3divi-001. Tridivi (3DiVi Inc.), Nga
Thuật toán - yitu-000. Công nghệ Yitu, Trung Quốc
Sản phẩm chính của Yitu là hệ thống nhận dạng khuôn mặt Dragonfly Eye, được sử dụng bởi hệ thống an ninh chính phủ ở nhiều thành phố khác nhau ở Trung Quốc. Trong ba tháng đầu sử dụng hệ thống này ở Thượng Hải, 567 người vi phạm pháp luật đã bị bắt giữ bằng Dragonfly Eye. Hệ thống lưu trữ 1,8 tỷ bức ảnh và cơ sở dữ liệu bao gồm ảnh không chỉ của công dân Trung Quốc mà còn của tất cả khách du lịch qua biên giới đất nước. Hệ thống này cũng được triển khai tại các sự kiện công cộng: trong lễ hội bia ở Thanh Đảo, camera đã giúp bắt giữ 22 người bị truy nã. Chính quyền địa phươngbáo cáo thành công : ở một thành phố, hệ thống Yitu đã giúp giảm 30% nạn móc túi, ở một thành phố khác, nó đã giải quyết được 500 tội phạm trong hai năm. Bằng một cách đáng kinh ngạc nào đó, hệ thống này thậm chí còn giúp xác định danh tính nạn nhân giết người bằng hộp sọ của anh ta 5 năm sau vụ án.
Thuật toán - khỉ đột-000, Công nghệ Gorilla, Đài Loan
Thuật toán - cyberextruder-002, CyberExtruder, Hoa Kỳ
Thuật toán - tongyitrans-002,Công nghệ vận tải TongYi, Trung Quốc
Thuật toán - yisheng-001,Công nghệ điện tử Chu Hải Yisheng, Trung Quốc

Tổng cộng: 5 đại diện đến từ Nga, đây là một tin tốt, 5 đại diện đến từ Trung Quốc, điều này thậm chí không có gì đáng ngạc nhiên.

Trên thực tế, có rất nhiều nhà sản xuất thuật toán nhận dạng khác; bạn có thể tìm thấy nhiều thuật toán còn thiếu ở đây trong bảng xếp hạng MegaFace. Nhưng ngay cả khi bạn lập một danh sách duy nhất, nó vẫn sẽ không đầy đủ. Hầu hết tất cả những gã khổng lồ trong ngành CNTT đều đang phát triển thuật toán nhận dạng khuôn mặt của riêng mình - Facebook, Google (coi hệ thống nhận dạng của họ là chính xác nhất), Baidu, Microsoft, Yandex (kiểm tra quyền tài xế bằng khuôn mặt và giọng nói), VKontakte, Toshiba và nhiều hãng khác.

Thậm chí có .

Từ tất cả sự đa dạng này, có thể rút ra một số kết luận đơn giản:

Cạnh tranh trên thị trường này sẽ ngày càng gay gắt và hậu quả của nó là giá cả giảm nhiều lần. Ví dụ: vào năm 2017, Macroscop đã giảm giá mô-đun nhận dạng xuống 18 lần. Họ vui vẻ báo cáo điều này trên trang web của mình, như thể gửi một lời chào chân thành đến tất cả những khách hàng may mắn mua được mô-đun nhận dạng trước năm 2017.

Rõ ràng là giá sẽ tiếp tục giảm.Các chỉ số chất lượng của các thuật toán nhận dạng không ngừng phát triển và trong nhiều trường hợp, chúng hơi khác nhau, giá cả khác nhau đáng kể, như bạn có thể thấy bên dưới, hiệu suất thậm chí còn khác biệt đáng kể hơn, tất nhiên, một thông số như hiệu suất phải được kiểm tra trên một cơ sở dữ liệu có kích thước tối đa.

Cũng dễ dàng nhận thấy rằng trong bảng xếp hạng thực tế không có nhà sản xuất thiết bị nào cho hệ thống giám sát video và không có máy quay video và thiết bị lưu trữ, toàn bộ câu chuyện với thuật toán này chỉ đang diễn ra trên máy tính. Nhưng việc họ không ở đó không có nghĩa là họ không nhìn thấy thị trường này và không hiểu được tầm quan trọng của nó. Đây là tính năng nhận dạng khuôn mặt của Panasonic, của NEC, Amazon và nhiều hãng khác. Nhìn chung, thị trường này sẽ sớm trở nên rất nóng. Ngoại trừ giải pháp phần mềm(đây là khi quá trình nhận dạng diễn ra trực tiếp trên máy chủ), cũng có đứng một mình giải pháp là khi sự nhận dạng xảy ra trên thiết bị đọc.

Phần mềm nhận dạng khuôn mặt cho hệ thống CCTV

Việc kiểm tra tính hiệu quả của thuật toán nhận dạng khuôn mặt tất nhiên là thú vị, giống như bất kỳ cuộc thi nào, nhưng nó giống một cuộc triển lãm thành tựu kinh tế quốc gia hơn. Nó có vẻ ấn tượng, nhưng không rõ chính xác làm thế nào để bắt đầu sử dụng nó và chi phí là bao nhiêu.

Kết quả công việc của các thuật toán nhận dạng khuôn mặt sẽ phù hợp hoặc không phù hợp với cơ sở tiêu chuẩn. Và sau đó, tùy thuộc vào đặc điểm cụ thể của hệ thống của bạn, một hành động được lập trình sẵn sẽ xảy ra. Ví dụ: khi khách hàng VIP đăng nhập, người quản lý cấp cao sẽ nhận được thông báo chứa tất cả dữ liệu khách hàng từ cơ sở dữ liệu của bạn.

Hoặc ngược lại, khi có người trong danh sách đen bước vào, bảo mật sẽ nhận được thông báo. Hoặc khi một người trong danh sách đen cố gắng đi qua trạm kiểm soát, hệ thống kiểm soát truy cập sẽ chặn lối đi - đây đã là sự tích hợp của hệ thống nhận dạng khuôn mặt với hệ thống kiểm soát truy cập.

Hoạt động của hệ thống nhận dạng khuôn mặt trong điều kiện thực tế là toàn bộ sự tương tác giữa phần mềm và phần cứng.

Để tổ chức các tương tác như vậy, có một loạt nền tảng tích hợp cho phép bạn thiết lập tương tác với hệ thống kiểm soát truy cập, hệ thống giám sát video, hệ thống an ninh, hệ thống an toàn phòng cháy chữa cháy, hệ thống CRM, hệ thống quản lý doanh nghiệp và nhiều nền tảng khác.

Vì vậy, nếu bạn không thích cờ đam nhưng may mắn thì một vài phần tiếp theo chỉ đơn giản là phần “Phải có” dành cho bạn.

Nền tảng tích hợp là một tên tuổi lớn; nó áp dụng cho các nhà phát triển được liệt kê dưới đây ở các mức độ khác nhau, vì vậy khi lựa chọn giải pháp nhận dạng khuôn mặt, bạn cần làm quen với tất cả các khả năng của phần mềm (nền tảng). Có tính đến cả nhu cầu hiện tại của doanh nghiệp và cơ hội phát triển, cả đặc điểm định tính của thuật toán nhận dạng khuôn mặt và khả năng tích hợp.

Nhà phát triển phần mềm cho hệ thống nhận dạng khuôn mặt và giá cho các mô-đun của họ

ISS, Nga, Phần mềm “SecurOS® Face”

Giấy phép mô-đun chụp khuôn mặt - giá 41.275 rúp

Đến kênh. Được cài đặt trên máy chủ nhận dạng khuôn mặt hoặc máy chủ chụp khuôn mặt

Giấy phép mô-đun nhận dạng khuôn mặt (tối đa 1000 người trong cơ sở dữ liệu) - giá 665.760 rúp.
Đến máy chủ nhận dạng khuôn mặt.

Máy chủ dành cho phần mềm cho mục đích nhận dạng khuôn mặt

Nhận dạng khuôn mặt, giống như bất kỳ phân tích video nào khác, là một nhiệm vụ đòi hỏi nhiều bộ xử lý, do đó, để triển khai ngay cả một hệ thống nhận dạng khuôn mặt nhỏ, bạn sẽ cần các máy chủ khá mạnh chứ không phải giá rẻ. Các đặc điểm của máy chủ được chọn riêng lẻ và phụ thuộc vào nhiều yếu tố - từ số lượng kênh nhận dạng, đến kích thước dự kiến của cơ sở dữ liệu về các khuôn mặt tham chiếu và thời lượng lưu trữ kho lưu trữ video.

Máy chủ cho phần mềm nhận dạng khuôn mặt - giá từ 101.567 rúp

Việc lựa chọn máy chủ không giới hạn ở những máy chủ được trình bày trong danh mục này; trong hầu hết các trường hợp, chúng tôi lắp ráp một máy chủ tùy theo yêu cầu đã nêu của bạn.

Camera IP tốt nhất để nhận dạng khuôn mặt

Chúng tôi đã thảo luận về phần mềm và máy chủ ở trên, nhưng để hệ thống hoạt động, bạn cần có camera IP. Chính đặc điểm chất lượng của camera sẽ quyết định rất lớn đến việc hệ thống nhận dạng khuôn mặt sẽ hoạt động tốt như thế nào.

Khi chọn camera IP để nhận dạng khuôn mặt, chúng tôi khuyên bạn nên chú ý đến các đặc điểm sau.

WDR (Dải động rộng)

Mặc dù thực tế là gần đây những chiếc máy ảnh có WDR đã xuất hiện với giá 5.000 rúp, nhưng chất lượng hình ảnh của những chiếc máy ảnh như vậy kém hơn nhiều so với những chiếc máy ảnh ở phân khúc giá cao hơn. Theo kinh nghiệm của chúng tôi, máy ảnh có WDR tốt nhất không thể có giá dưới 80.000 rúp.

Tốc độ khung hình ít nhất là 60 khung hình mỗi giây

Tốc độ khung hình trên giây càng cao thì khả năng bạn có được bức ảnh có hướng khuôn mặt người đó so với máy ảnh càng cao, điều này sẽ ảnh hưởng trực tiếp đến chất lượng nhận dạng khuôn mặt.

Ống kính Varifocal

Càng có nhiều pixel trên khuôn mặt của một người thì hình ảnh sẽ càng lớn.

Các thử nghiệm đã chỉ ra rằng để nhận dạng khuôn mặt thành công, khuôn mặt phải được thể hiện bằng ít nhất 160 pixel trên mỗi hình bầu dục của khuôn mặt và lý tưởng nhất là ít nhất 50 pixel ở khoảng cách giữa hai mắt. Cho dù bạn có chọn vị trí camera cẩn thận đến đâu thì để đạt được những giá trị này, nó sẽ phải được điều chỉnh cục bộ tùy thuộc vào nhiều yếu tố. Đây là lý do tại sao bạn cần một ống kính đa tiêu cự.

Camera quan sát được cài đặt thông số kỹ thuật nhận dạng khuôn mặt được đề xuất- giá từ 10.000 rúp

Sau đó, như họ nói, sự lựa chọn là của bạn. Nếu bạn đang xây dựng một hệ thống nhận dạng từ đầu, thì bạn nên nghĩ đến việc chọn những mẫu camera IP thực sự được thử nghiệm tốt nhất.

Một chức năng khá phổ biến và rẻ tiền, theo quy luật, nó luôn có trong phần mềm nhận dạng khuôn mặt chính, nhưng cũng có thể được mua riêng. Nếu bạn chưa bao giờ quan tâm đến hệ thống giám sát video trong đời. Hãy xem video và nó sẽ giải thích bản chất một cách ngắn gọn nhất có thể.

ITV, Nga, phần mềm trí tuệ

Tìm kiếm khuôn mặt trong kho lưu trữ (cho 1 kênh video) - giá 6.200 rúp

Trassir, Nga, Phần mềm “Tìm kiếm khuôn mặt Trassir”

Mô-đun tìm kiếm một người cụ thể trong kho lưu trữ Trassir Face Search - giá 36.990 rúp

Hầu hết các nhà phát triển đều có chức năng này ở dạng này hay dạng khác, vì vậy có lẽ chúng tôi sẽ không kéo dài bài viết vốn đã ngắn này.

Nhà sản xuất thiết bị tích hợp thuật toán nhận dạng khuôn mặt

Nếu phần trên với nhà phát triển phần mềm là có thật, tức là. Đây là nơi tập trung các giải pháp chính mang lại hiệu quả tối đa vào thời điểm hiện tại. Phần này nói về tương lai đang đến.

Trong trường hợp đầu tiên, luồng video từ camera được truyền qua mạng đến máy chủ có cài đặt phần mềm và tại đó, luồng video từ một camera IP có tốc độ khoảng 5 Mbit/s và luồng này phải là. được truyền qua mạng đến máy chủ và được xử lý ở đó. Trong trường hợp một camera, mọi thứ có vẻ chấp nhận được, nhưng nếu có hàng trăm camera thì đây là một vấn đề cần được giải quyết riêng. Nó có thể được giải quyết chủ yếu bởi hàng chục máy chủ để xử lý dữ liệu; bất kỳ phân tích video nào cũng là một nhiệm vụ đòi hỏi nhiều bộ xử lý. Vì vậy, máy chủ sẽ là một khoản chi phí đáng kể.

Sẽ hiệu quả hơn nhiều khi nhận ra trên thiết bị và chuyển các kết quả đã được xử lý qua mạng, điều này sẽ giảm tải cho mạng và máy chủ theo mức độ lớn.

Ngoài thực tế là những thiết bị như vậy đã tồn tại, chúng còn cho thấy hiệu quả và tốc độ đáng kinh ngạc. Tôi sẽ chia tất cả các thiết bị thành hai nhóm lớn: “Camera CCTV có tích hợp nhận dạng khuôn mặt” và “Thiết bị cho hệ thống kiểm soát truy cập có tích hợp nhận dạng khuôn mặt”.

Camera quan sát tích hợp nhận dạng khuôn mặt

Máy ảnh thông minh có thuật toán nhận dạng khuôn mặt tích hợp là một trong những máy ảnh tiên tiến nhất trong ngành. Chúng cho phép bạn xử lý luồng video trực tiếp trên chính máy ảnh và gửi siêu dữ liệu đã xử lý đến máy chủ.

Máy ảnh 2MP iDS-2CD8426G0/F-I với hai ống kính - giá 135.550 rúp

HikVision, Trung Quốc, nhà sản xuất hệ thống giám sát video lớn nhất Trung Quốc.
Cảm biến - CMOS quét lũy tiến 1/2.8''
Độ nhạy - Màu sắc: 0,005 Lux @ (F1.2, AGC ON), 0,0089 Lux @ (F1.6, AGC ON), 0 Lux với IR
Tốc độ màn trập điện tử - 1 giây ~ 1/100000 giây
Độ phân giải 2MPPhần cứng WDR 120dB, tốc độ khung hình 25fps@2MP, khe cắm thẻ nhớ microSD lên tới 128GB, chiếu sáng hồng ngoại lên tới 10m

Camera nhận dạng khuôn mặt với hai ống kính là một thiết bị nhỏ gọn có thuật toán học sâu DeepinView với hệ thống nhận dạng khuôn mặt tích hợp.

Máy ảnh này hỗ trợ một số codec nén video (H.265, H.264, MPEG-4 và MJPEG) và có thể xử lý tối đa năm luồng video. Kích thước của máy quay video là 180,4 x 147 x 117,9 mm, trọng lượng của máy là 1500 gram. Về mặt cấu trúc, nó là một máy ảnh hai ống kính với công nghệ âm thanh nổi hai mắt, đọc một số lượng lớn các đặc điểm khuôn mặt để nhận dạng chính xác hơn.

Nó được trang bị một ống kính có tiêu cự cố định 4 mm và góc nhìn 86°. Camera sẽ tự động chụp, chọn lọc và hiển thị hình ảnh tối ưu về khuôn mặt của một người.

Thực hiện nhận dạng khuôn mặt, so sánh tức thì các khuôn mặt đã chụp với các thư viện tích hợp và hỗ trợ thiết lập kích hoạt cảnh báo dựa trên khuôn mặt đã được xác định.

HikVision tuyên bố nhiệt độ hoạt động từ -10°C đến 40°C và độ ẩm lên tới 95%.

Camera tự động chuyển đổi giữa chế độ ngày và đêm. Chiếu sáng hồng ngoại hoạt động ở khoảng cách lên tới 10 mét.

DVR iDS-96128NXI-I16 với hệ thống nhận dạng khuôn mặt - giá 3.299.990 rúp

Quay video lên tới 12MP, đầu ra video lên tới 4K
128 kênh, Phát lại đồng bộ 4 kênh@4K
16 ổ cứng SATA có dung lượng lên tới 10TB mỗi ổ
Đầu vào/đầu ra âm thanh 1/2, đầu vào/đầu ra cảnh báo 16/8
Giao diện mạng 4 RJ-45 10M/100M/1000M Ethernet

Bộ nhớ DVR được thiết kế cho 16 thư viện hình ảnh của mọi người (tổng cộng lên tới 100.000 ảnh)

DVR hỗ trợ các chức năng Thông minh để tìm kiếm những người tương tự, phân tích hành vi và phát hiện khuôn mặt và ô tô.
Có thể làm việc với máy ảnh nhiệt, phát hiện đám cháy, phát hiện tàu biển, đo nhiệt độ, duy trì số liệu thống kê của camera bản đồ nhiệt và đếm du khách.
iDS-96128NXI-I16 có khả năng phát hiện người trên 32 kênh và lập mô hình khuôn mặt với tốc độ 64 ảnh mỗi giây.

Máy ghi âm có các giao diện 1 RS-232, 1 RS-485, RS-485 cho bàn phím và hai đầu nối USB 2.0 và USB 3.0, cũng như 16 đầu vào cảnh báo và 8 đầu ra.

IDS-96128NXI-I16 hỗ trợ sử dụng mảng đột kích RAID0, RAID1, RAID5, RAID6 và RAID10.

Camera quan sát DH-IPC-HF8242F-FR với hệ thống nhận dạng khuôn mặt trên tàu - giá 100.000 rúp
Công nghệ Dahua, Trung Quốc
1/1.9", 2 MP quét lũy tiến Bộ giải mã CMOSSmart 265+/H.264+, mã hóa 3 luồng
Ánh sáng sao, WDR thực 120dB, 3DNR, Ngày/Đêm (ICR), AWB, AGC, BLC
Giám sát nhiều mạng: Trình xem web, CMS (DSS/PSS) & DMSS
Tự động lấy nét lùi (ABF)

Chụp khuôn mặt là một ứng dụng phần mềm tự động chụp khuôn mặt từ chuỗi hình ảnh hoặc video kỹ thuật số từ nguồn video. Camera Dahua sử dụng thuật toán Deep Learning tiên tiến, cho phép camera nhận dạng và khớp khuôn mặt một cách nhanh chóng và chính xác.

Camera nhận dạng khuôn mặt DH-IPC-HF8242FP-FR sử dụng công nghệ Deep Learning để nhận dạng và khớp khuôn mặt một cách hiệu quả. Các chức năng phân tích của thiết bị cho phép bạn xác định độ tuổi, giới tính, tâm trạng, sự hiện diện hay vắng mặt của mặt nạ/kính/râu hoặc ria mép.

Máy quay video có chức năng đếm người và tạo bản đồ nhiệt.
Bộ nhớ máy ảnh chứa tới 10.000 khuôn mặt, có thể chia thành 5 loại, cho phép chụp và so sánh khuôn mặt theo thời gian thực.

Nhờ công nghệ Starlight của Dahua, máy ảnh này lý tưởng để làm việc trong môi trường khó khăn với ánh sáng hạn chế.
Độ nhạy sáng thấp của nó đảm bảo hiệu suất hình ảnh màu với ánh sáng xung quanh tối thiểu. Ngay cả trong điều kiện ánh sáng cực yếu, bóng tối gần như hoàn toàn, công nghệ Starlight vẫn có thể hiển thị hình ảnh màu.

Camera quan sát IPC2255-Gi4N với hệ thống nhận dạng khuôn mặt trên tàu - giá 100.000 rúp

Kedacom, Trung Quốc
Ma trận ánh sáng sao CMOS 1/1.9", 0,001 lux với hình ảnh màu 1080@30 khung hình / giây ở H.265 / H.264 / MJPEG
Nhận dạng đồng thời tới 18 mục tiêu (hình ảnh, khuôn mặt)
WDR phần cứng, chiếu sáng hồng ngoại thích ứng lên tới 100m
2 đầu vào cảnh báo / 1 đầu ra, Cấp bảo vệ IP66, Phạm vi nhiệt độ -40°C +60°C

Máy quay video Axis P1367 tích hợp thuật toán Ayonix - giá 68.448 rúp

Ayonix, Nhật Bản
Ma trận 1/2.9” với chức năng quét lũy tiến
Tiêu cự thay đổi 2,8–8,5 mm
Chất lượng video vượt trội với độ phân giải 5 MP
Công nghệ Lightfinder và Forensic WDR, công nghệ Zipstream
Khả năng phân tích hình ảnh nâng cao

Nhà phát triển phần mềm nhận dạng khuôn mặt Nhật Bản Ayonix đã phát triển phần mềm để hoạt động trên máy ảnh Axis P1367.

Nhờ nền tảng ACAP, các nhà phát triển bên thứ ba có thể phát triển ứng dụng để cài đặt trực tiếp trên camera Axis.

Thiết bị đầu cuối cho hệ thống chấm công và chấm công có tích hợp nhận dạng khuôn mặt

Thiết bị đầu cuối chấm công và chấm công FacePass Pro - giá 23.000 rúp

Anviz, Trung Quốc
Dung lượng bộ nhớ cho 400 người dùng
Thời gian nhận dạng< 0,1 сек
Khoảng cách nhận dạng người dùng: từ 30 cm đến 80 cm
Tỷ lệ nhận dạng: >99%
Màn hình cảm ứng TFT 2,8” nhạy cảm
Máy chủ Web tích hợp để thiết lập thiết bị đầu cuối dễ dàng

Hai camera quét đảm bảo nhận dạng chính xác nhất, đồng thời bộ xử lý Samsung ARM tốc độ cao giúp giảm thiểu thời gian nhận diện khuôn mặt nhân viên

Ngay cả những yếu tố như màu da, nét mặt, giới tính, kiểu tóc cũng như sự hiện diện hay vắng mặt của lông mặt cũng không ảnh hưởng đến độ chính xác và tốc độ nhận dạng.

Anviz FacePass Pro là hệ thống theo dõi thời gian của nhân viên với tính năng nhận dạng khuôn mặt, thẻ RFID hoặc mật khẩu không tiếp xúc.

Sự kết hợp giữa thuật toán BioNANO mới với phần cứng hiệu suất cao đảm bảo nhận dạng người dùng trong vòng chưa đầy 0,1 (!) Giây.

Hệ thống chiếu sáng hồng ngoại độc đáo đảm bảo thiết bị hoạt động ổn định cả trong phòng có điều kiện ánh sáng khác nhau và trong bóng tối hoàn toàn.
Tốc độ và chất lượng nhận dạng thậm chí không bị ảnh hưởng bởi các yếu tố như màu da, nét mặt, giới tính, kiểu tóc cũng như việc có hay không có râu hoặc ria mép trên khuôn mặt.

Bàn phím số động và màn hình cảm ứng TFT 2,8” nhạy bén đảm bảo thao tác thoải mái.

Thiết bị đầu cuối chấm công và chấm công đa sinh trắc học ZKTeco Pface202-ID - giá 26.500 rúp

ZKTeco, Trung Quốc

Bộ nhớ dành cho 600 mẫu tĩnh mạch lòng bàn tay, 1200 khuôn mặt (lên tới 3000 với xác minh 1: 1), 2000 ngón tay và 10000 thẻ
Dung lượng nhật ký 100.000 mỗi sự kiện
Màn hình LCD cảm ứng 4.3''
Đầu đọc thẻ tích hợp Em-Marin

Thiết bị đầu cuối sinh trắc học mạng dành cho hệ thống chấm công và kiểm soát truy cập với khả năng nhận dạng bằng khuôn mặt, tĩnh mạch lòng bàn tay, dấu vân tay, đầu đọc thẻ RFID và kết nối ethernet.

Thiết bị đầu cuối chấm công và chấm công đa sinh trắc học ZKTeco uFace302-ID - giá 27.405 rúp

Dung lượng bộ nhớ là 1.200 mẫu khuôn mặt, 2.000 dấu vân tay và 10.000 thẻ
Nhật ký sự kiện cho 100.000 mục
Tốc độ nhận dạng cao
Giao diện TCP/IP, RS232/485, Máy chủ USB, đầu ra Wiegand
Đầu ra để kết nối khóa điện, cảm biến trạng thái cửa, nút thoát, đầu ra cảnh báo
Sử dụng mã hóa phần cứng để bảo vệ phần sụn

Thiết bị đầu cuối sinh trắc học để theo dõi thời gian và kiểm soát truy cập UFace302-ID cung cấp khả năng nhận dạng bằng khuôn mặt, dấu vân tay, thẻ và mã. Face302-ID có thể phân biệt khuôn mặt của người thật với hình ảnh. Giao diện người dùng tiên tiến và thân thiện được cung cấp bởi màn hình cảm ứng 4 inch (Touch Screen).

Thiết bị chấm công và chấm công sinh trắc học ZKTeco uFace800 - giá 27.405 rúp

Camera quét khuôn mặt kép độ phân giải cao tích hợp với đèn hồng ngoại
Bộ nhớ lên tới 3.000 khuôn mặt, 5.000 ngón tay, 10.000 thẻ và 100.000 sự kiện
Nền tảng ZMM220_TFT, thuật toán ZK Face 7.0, ZK Finger 10.0
6 trạng thái sự kiện khi đăng ký
Máy quét dấu vân tay, đầu đọc thẻ tích hợp
Giao diện TCP/IP, USB Host, WiFi (tùy chọn), đầu ra Wiegand

Thiết bị đầu cuối sinh trắc học mạng dành cho hệ thống chấm công và kiểm soát truy cập với nhận dạng khuôn mặt, máy quét dấu vân tay, đầu đọc thẻ RFID và kết nối ethernet.
uFace800 hỗ trợ điều khiển khóa, điều khiển cảm biến cửa, chuông, cảm biến chống trộm, kết nối nút thoát hiểm.

Thiết bị cho hệ thống kiểm soát truy cập có tích hợp nhận dạng khuôn mặt

Thiết bị đầu cuối nhận dạng khuôn mặt FaceStation 2 - giá 80.856 rúp

Suprema, Hàn Quốc. Nhà sản xuất sinh trắc học lớn nhất thế giới, một trong 50 nhà sản xuất hệ thống bảo mật lớn nhất toàn cầu.
Hệ thống vi xử lý: Quard Core 1,4 GHz, Bộ nhớ: 8 GB Flash + 1 GB RAM
Bộ nhớ tự động cho 30.000 người dùng, 5.000.000 sự kiện, 50.000 ảnh
Nhận dạng nhanh - so sánh 1:3.000 mẫu mỗi giây
Màn hình cảm ứng Màn hình cảm ứng LCD 4 inch, đèn nền lên tới 25000 lux
Hoạt động ổn định trong mọi ánh sáng nhờ đèn nền 25.000 lux

FaceStation 2 là một nền tảng nhận dạng khuôn mặt hiệu suất cao. Nhận dạng khuôn mặt có thể được sử dụng ở cả chế độ nhận dạng và xác minh. Ngoài nhận dạng khuôn mặt, nhận dạng bằng điện thoại thông minh và thẻ không tiếp xúc cũng được hỗ trợ.

Để giải quyết các vấn đề ACS cụ thể trên một đối tượng thực, người dùng có thể chọn các chế độ nhận dạng (1:N) hoặc xác minh (1:1) khác nhau từ danh sách rộng do FaceStation 2 cung cấp.
Như vậy, có thể lựa chọn sự cân bằng tối ưu giữa mức độ bảo mật và tốc độ hoạt động trong từng trường hợp cụ thể.

Tùy thuộc vào chế độ đã chọn, nhiều tổ hợp cảm biến sinh trắc học, đầu đọc thẻ thông minh tích hợp và bàn phím cảm ứng để nhập mã PIN sẽ được sử dụng.
Nhận dạng khuôn mặt không tiếp xúc và khả năng sử dụng điện thoại thông minh thay vì thẻ truy cập khiến FaceStation 2 cực kỳ thân thiện với người dùng.

Thiết bị đầu cuối nhận dạng khuôn mặt hiệu suất cao, có đầu đọc thẻ đa tần số tích hợp (125kHz EM & 13,56Mhz MIFARE, DESFire/EV1, FeliCa, NFC, ISO14443A/B, ISO15693).

Nhờ vùng nhận dạng được mở rộng, thiết bị được cài đặt theo hướng dẫn “nhìn thấy” khuôn mặt của những người có chiều cao từ 145 cm đến 210 cm.
Thiết bị đầu cuối được trang bị các tính năng bảo mật tiên tiến như công nghệ hồng ngoại chống giả khuôn mặt và công nghệ đọc RF đa băng tần hỗ trợ các tiêu chuẩn RFID mới nhất.

Ngoài ra còn có một sửa đổi thiết bị đầu cuối FaceStation 2 (model FS2-AWB) - giá 93.850 rúp, có đầu đọc MultiCLASS SE tích hợp (125kHz EM, HID Prox & 13,56Mhz MIFARE, DESFire/EV1, FeliCa, iCLASS SE/SR, NFC, ISO14443A/B, ISO15693).

Và tất nhiên, các giải pháp từ các đối tác Trung Quốc của chúng tôi, những người sẽ không phải là đối tác Trung Quốc nếu họ không cung cấp công nghệ hiện đại rẻ hơn 3-4 lần. Giá rẻ chắc chắn không dẫn đến hậu quả, một trong những khác biệt chính là kích thước của cơ sở dữ liệu, đối với người Trung Quốc nhỏ hơn ít nhất 5 lần, tốc độ và độ chính xác cũng bị ảnh hưởng một chút. Nhưng về nguyên tắc, đây là những giải pháp hoàn toàn có hiệu quả, mang tính địa phương dành cho các doanh nghiệp nhỏ.

Thiết bị nhận dạng sinh trắc học đa yếu tố ZKTeco VF680 - giá 13.410 rúp

ZKTeco®, Trung Quốc, nhà sản xuất sinh trắc học lớn nhất Trung Quốc, phát triển độc lập các thuật toán nhận dạng.
Nền tảng ZEM810, thuật toán ZK Face 7.0
Camera quét khuôn mặt kép độ phân giải cao tích hợp với đèn hồng ngoại
Bộ nhớ cho 800 khuôn mặt, lên tới 10.000 và 100.000 sự kiện
Tốc độ xác minh không quá 1 giây
Kết nối TCP/IP

VF680 có thể hoạt động độc lập hoặc kết nối với hệ thống kiểm soát truy cập nối mạng. Thiết bị đầu cuối được trang bị nền tảng ZEM810, màn hình cảm ứng 3,0 inch và thuật toán ZK Face 7.0, hỗ trợ 800 khuôn mặt.
Đầu đọc có thể được lập trình từ bàn phím tích hợp hoặc sử dụng phần mềm.

Thiết bị nhận dạng sinh trắc học đa yếu tố ZKTeco MultiBio700id - giá 28.530 rúp

Phiên bản thuật toán: ZK Face v7.0 và ZK Finger v10.0

100.000 sự kiện trong nhật ký
Nhận dạng trong vòng 1 giây

Thiết bị đầu cuối đa sinh trắc học ZKTeco Multibio700 cung cấp quyền truy cập bằng khuôn mặt, dấu vân tay, thẻ không tiếp xúc và mã.
Thiết bị ghi lại vị trí, kích thước và hình dạng tương đối của mắt, mũi, xương gò má và hàm và tạo thành một mẫu sinh trắc học từ dữ liệu này để so sánh sau này.
Nhận dạng người dùng chính xác và nhanh chóng trong vòng 1 giây. Chiếu sáng hồng ngoại giúp thực hiện nhận dạng thành công trong điều kiện ánh sáng yếu.

Để điều khiển trực tiếp khóa, thiết bị đầu cuối có thể được sử dụng tự động hoặc được kết nối như một đầu đọc với các hệ thống truy cập mạng bằng giao diện Wiegand.

Đầu đọc sinh trắc học ZKTeco SpeedFace V5

Vi xử lý Quad-Core A17 1.8GHz, Bộ nhớ RAM 2G/ROM 16G
Camera kép: Camera hồng ngoại + Camera ánh sáng nhìn thấy được
Hoạt động dưới ánh sáng 0 ~ 40.000Lux
màn hình cảm ứng 5 inch
Bộ nhớ cho 6.000 ~ 10.000 (1:N) khuôn mặt
Tốc độ xác minh dưới 1 giây
Đầu đọc hỗ trợ nhận diện khuôn mặt, vân tay và thẻ RFID EM-Marine hoặc Mifare.

Nhận dạng khuôn mặt bằng ánh sáng nhìn thấy vượt trội hơn nhiều lần so với nhận dạng khuôn mặt IR và khoảng cách nhận dạng đã tăng lên 2 mét, giúp đơn giản hóa đáng kể tình huống trong giờ cao điểm. Không cần phải đứng lâu trước camera của thiết bị. Người dùng có thể nhanh chóng đi theo hướng mong muốn bên cạnh thiết bị để khuôn mặt lọt vào tầm nhìn của camera.

Nhờ sử dụng CNN và tạo ra mô hình 3D của khuôn mặt, khả năng nhận dạng từ các góc nhìn khác nhau đã trở nên khả thi. Sử dụng thuật toán CNN thông minh, chức năng chống giả mạo sẽ ngăn chặn hiệu quả việc truyền mặt nạ, ảnh và video.

Thiết bị đầu cuối truy cập sinh trắc học HikVision DS-K1T606M - giá 49.990 rúp

HikVision, Trung Quốc
Bộ nhớ cho 3.000 mẫu khuôn mặt, 5.000 thẻ định dạng Mifare và 100.000 sự kiện trong nhật ký
2 đầu vào cảnh báo và 1 đầu ra
Giao diện truyền thông TCP/IP; Wifi; Giao thức EHome; RS-485; Wiegand 26/34
Điều kiện hoạt động -20 °C đến +50 °C, độ ẩm 10% - 90%
Thích hợp lắp đặt ngoài trời

Đầu đọc có bộ điều khiển tích hợp và thuật toán nhận dạng khuôn mặt ST-FR040EM - giá 26.824 rúp
Smartec, Nga, một thương hiệu ô tô của Nga, đặt hàng với một loạt nhà máy Trung Quốc và bán ở Nga dưới một thương hiệu Smartec duy nhất.
Phiên bản thuật toán: ZK Face v7.0 và ZK Finger v10.0
Camera hồng ngoại độ phân giải cao, màn hình cảm ứng 3"
Dung lượng bộ nhớ cho 400 mẫu khuôn mặt, 2000 dấu vân tay và 1000 thẻ không tiếp xúc
Nhận dạng trong vòng 1 giây
Đầu đọc RFID tích hợp Em-Marine 125kHz

Nếu bạn thấy nó giống với ZKTeco MultiBio700ID thì bạn đã đúng. Đối với Smartec, đầu đọc này được sản xuất bởi ZKTeco và nó là bản sao hoàn chỉnh của MultiBio700ID.

Liên lạc nội bộ với hệ thống nhận dạng khuôn mặt tích hợp DS06M - giá 14.300 rúp

Bevard, Nga
Cảm biến SONY Exmor 1,3 MP, độ nhạy 0,01 Lux
Hoạt động ở nhiệt độ từ -40 đến +50°С, cấp bảo vệ IP54
Đã lắp thẻ nhớ microSDHC 4GB, ghi vào thẻ nhớ
Âm thanh hai chiều
Hỗ trợ dịch vụ đám mây Camdrive

Đừng vội vui mừng vì mức giá thấp, cơ sở dữ liệu chứa tối đa 30 cá nhân. Nhưng nếu bạn có một doanh nghiệp nhỏ và muốn tạo hiệu ứng WOW cho khách truy cập thì đây có thể là cách tốt nhất.

Nhân tiện, bất kỳ hệ thống liên lạc nội bộ IP nào cũng có thể được trang bị hệ thống nhận dạng khuôn mặt, tốt nhất là có camera IP thông thường.
Và hơn thế nữa, hệ thống liên lạc nội bộ IP được lắp đặt chính xác ngang tầm khuôn mặt hoặc thấp hơn một chút, rất lý tưởng để nhận dạng khuôn mặt chất lượng cao.

Cùng một hệ thống liên lạc nội bộ Bevard, nhưng được kết nối với hệ thống nhận dạng khuôn mặt Makrscope, trong trường hợp này phần mềm Makrscope được cài đặt trên máy chủ. Trong cấu hình này, kích thước của cơ sở dữ liệu chỉ bị giới hạn bởi khả năng tài chính của bạn.

Kính có hệ thống nhận dạng khuôn mặt đã sẵn sàng công dụng Cảnh sát thành phố Trịnh Châu

Công nghệ LLVision, Trung Quốc

Được kết nối với cơ sở dữ liệu của cảnh sát, chiếc kính này sẽ cung cấp tên và địa chỉ của một người trong vòng 2-3 phút. Trong suốt một tuần rưỡi, 7 người bị truy nã và 26 người mang thẻ căn cước giả đã bị giam giữ bằng kính tại nhà ga xe lửa Zhengzhou.

Ngoài hacker, còn có Đồng chí Thiếu tá có mặt khắp nơi, người tỏ ra không kém phần quan tâm đến dữ liệu sinh trắc học. WikiLeaks đã xuất bản một thông báo (url bị RosKomNadzor chặn một cách thận trọng) về khả năng bị đánh cắp cơ sở dữ liệu Aadhaar của CIA, sử dụng thiết bị được sử dụng để quét dấu vân tay và mống mắt từ công ty Cross Match (Hãy nhớ rằng công ty Mỹ này vẫn đang tích cực quảng bá thiết bị của mình, bao gồm cả trên thị trường quốc tế)

Đương nhiên, bản thân Aadhaar cung cấp quyền truy cập cho các công ty thương mại, chẳng hạn như Microsoft sử dụng Aadhaar để xác minh danh tính người dùng phiên bản đặc biệt của Skype dành cho Ấn Độ.

Việc cho phép các công ty thương mại truy cập vào cơ sở dữ liệu sinh trắc học của chính phủ có rất nhiều ý nghĩa. Theo quy định, bản thân dữ liệu sinh trắc học không được truyền đi mà chỉ có kết quả nhận dạng được truyền đi. Ngoài thực tế là các dịch vụ này được trả tiền, chính nhờ những khoản thu này mà cơ sở dữ liệu sinh trắc học của tiểu bang được tạo ra và duy trì.

Nga cũng có Aadhaar của riêng mình; rõ ràng cơ sở dữ liệu của Nga khó có thể tránh khỏi mọi vấn đề mà Aadhaar đã trải qua.

Nó được lên kế hoạch để cung cấp quyền truy cập vào cơ sở dữ liệu của Nga cho các ngân hàng.

Cũng có những ví dụ về cách tiếp cận khác; Bỉ là quốc gia đầu tiên cấm các tổ chức thương mại sử dụng hệ thống nhận dạng khuôn mặt.

Cơ sở dữ liệu tạithích hợp cho các công ty thương mại
Nhà nước, mặc dù có độc quyền về thu thập dữ liệu bắt buộc, nhưng thường không phải là cơ quan thu thập dữ liệu hiệu quả nhất.

Đó là lý do tại sao chúng ta có một số lượng lớn cơ sở dữ liệu thương mại về thông tin sinh trắc học. Cơ sở dữ liệu lớn nhất - VKontakte (hơn 97.000.000 người sử dụng hàng tháng VKontakte), chẳng hạn, NtechLab sử dụng nó cho trang web FindFace, Facebook và các mạng xã hội và trang web hẹn hò khác cũng có cơ sở dữ liệu lớn.

Cơ sở dữ liệu thương mại được tạo ra để các công ty thương mại khác có thể sử dụng chúng với số tiền khiêm tốn.

Ví dụ: Bitrix24 trong các sản phẩm của mình Trình theo dõi khuôn mặt, Thẻ khuôn mặt cho 1C, Bitrix24. Trình theo dõi thời gian và khách truy cập sử dụng cơ sở dữ liệu VKontakte.

Cơ sở dữ liệu tốt nhất
Tất cả các cơ sở dữ liệu trên đều có một nhược điểm đáng kể: chúng không liên quan gì đến doanh nghiệp của bạn. Và chúng chỉ chứa một số bộ dữ liệu nhất định, thường là những bộ cực kỳ hữu ích, nhưng nếu không tính đến các chi tiết cụ thể về doanh nghiệp của bạn thì việc sử dụng chúng sẽ rất hạn chế.

Một trong những chỉ số quan trọng nhất về chất lượng cơ sở dữ liệu của bạn sẽ là chất lượng hình ảnh khuôn mặt, tài liệu tham khảo.
Các chỉ số chất lượng quan trọng nhất của cơ sở dữ liệu hình ảnh tham chiếu là:
Số lượng pixel
Độ tương phản và chi tiết của khuôn mặt
Nền trên đó đặt phần chính của khuôn mặt
Không có bộ phận đáng lo ngại trên vùng mặt, v.v.

Điều quan trọng nữa là phải quan sát ít nhiều các điều kiện giống hệt nhau để thu được hình ảnh khuôn mặt (ánh sáng, kích thước của khuôn mặt so với nền của toàn bộ hình ảnh).

Điều quan trọng là phải tính đến các chỉ số này ở giai đoạn thiết kế của hệ thống nói chung, đặc biệt chú ý đến hệ thống để đạt được các tiêu chuẩn khuôn mặt được công nhận.
Bắt đầu xây dựng cơ sở dữ liệu của bạn ngay hôm nay!

Sử dụng cơ sở dữ liệu sinh trắc học
Nhiều người có những lo ngại hợp lý về việc chính phủ sử dụng dữ liệu sinh trắc học và thậm chí còn lo ngại hơn về việc các tổ chức thương mại sử dụng dữ liệu này.

Quả thực, những lo ngại này không phải là không có cơ sở, nhưng chúng không nên ngăn cản việc triển khai công nghệ. Trong tương lai gần, đó là của chúng tôi bản sắc sinh học sẽ cho phép phân biệt con người với trí tuệ nhân tạo.

Màn hình có dữ liệu về số lượng bot và người thực truy cập trang web, nghiên cứu được thực hiện bởi Imperva Incapsula

Ngay cả ở thời điểm hiện tại, số lượng bot và số lượng người thực truy cập các trang web vẫn xấp xỉ nhau. Với sự phát triển của Internet of Things và trí tuệ nhân tạo, số lượng bot sẽ tăng lên theo cấp số toán học, cũng như khả năng của chúng; đã có những giải pháp có thể thay mặt bạn gọi đến tiệm làm tóc hoặc tiệm bánh pizza.

Các lĩnh vực ứng dụng hệ thống nhận dạng khuôn mặt

Ứng dụng cụ thể của công nghệ nhận dạng khuôn mặt khác nhau về mức độ nghiêm trọng của lỗi tùy thuộc vào phạm vi ứng dụng.

Hệ thống kiểm soát truy cập

Một trong những ứng dụng tốt nhất của hệ thống nhận dạng khuôn mặt ở thời điểm hiện tại là trong hệ thống kiểm soát truy cập. Thứ nhất, bản thân nhân viên quan tâm đến việc cung cấp quyền truy cập cho anh ta và sẽ không cố tình phá hoại hoạt động của hệ thống nhận dạng khuôn mặt. Thứ hai, bạn kiểm soát tất cả các yếu tố bên ngoài ảnh hưởng đến chất lượng nhận dạng - ánh sáng, phông nền, kiểu di chuyển của nhân viên. Sử dụng tất cả điều này bạn có thể tạo ra điều kiện lý tưởng.

Hệ thống nhận dạng khuôn mặt có thể được sử dụng trong hệ thống kiểm soát truy cập ở hai chế độ:

Chế độ nhận dạng - quyết định nhập học chỉ được đưa ra dựa trên dữ liệu từ hệ thống nhận dạng khuôn mặt. Ví dụ, cơ sở dữ liệu về nhân viên của bạn bao gồm 100 người và nhiệm vụ của hệ thống nhận dạng là so sánh khuôn mặt của người hiện tại với cơ sở dữ liệu 100 người. Nghĩa là, sự so sánh xảy ra 100:1. Nếu một người được xác định là nhân viên, anh ta sẽ được cấp quyền truy cập.

Thiết bị đầu cuối nhận dạng khuôn mặt từ HikVision

Chế độ này được sử dụng hiệu quả nhất trong nhiệm vụ phát hiện người lạ trong khu vực được kiểm soát. Theo quy định, sẽ hợp lý khi sử dụng các doanh nghiệp trong các khu vực được bảo vệ đặc biệt, nơi một số lượng người hạn chế được phép tiếp cận. Tất cả các camera được lắp đặt trong một khu vực nhất định đều được kết nối với hệ thống nhận dạng; nếu phát hiện bất kỳ người nào không có trong cơ sở dữ liệu, cơ quan an ninh sẽ được thông báo.

Chế độ xác minh - việc nhận dạng trong trường hợp này được thực hiện bằng công nghệ khác, ví dụ: RFID (nếu bạn là người bảo thủ) hoặc có thể sử dụng số nhận dạng di động hoặc dấu vân tay hoặc mẫu tĩnh mạch của bàn tay hoặc ngón tay , nếu bạn quyết định gió thổi theo hướng nào trong xu hướng ACS hiện đại và không muốn lãng phí tiền.

Một người mang thẻ đến đầu đọc, hệ thống sẽ nhận dạng người đó, tức là xác định đó là Ivanov và lúc đó Ivanov được phép truy cập. Hệ thống nhận dạng khuôn mặt trong trường hợp này đã biết đây là Ivanov và chỉ sử dụng ảnh của Ivanov từ cơ sở dữ liệu để so sánh người mang thẻ RFID với ảnh của Ivanov trong cơ sở dữ liệu. Nghĩa là, sự so sánh xảy ra 1:1.

Ở chế độ xác minh, nó thường hoạt động hoàn hảo vì nhiệm vụ xác minh rất đơn giản ngay cả đối với các hệ thống nhận dạng khuôn mặt chất lượng trung bình.

Chế độ này được khuyến khích sử dụng tại bất kỳ điểm vào nào - trung tâm thương mại, doanh nghiệp sản xuất, viện, trường học.

Nhiệm vụ của hệ thống nhận dạng khuôn mặt là xác minh chủ thẻ. Thông thường nhiệm vụ này được thực hiện bởi nhân viên bảo vệ hoặc người canh gác. Và đây không phải là ý tưởng hay nhất, trừ khi bạn là một nhà văn học dân gian và không theo đuổi mục tiêu biên soạn một “bách khoa toàn thư về văn hóa hiện đại”

Nhân viên bảo vệ hiển thị ảnh của người đó trên màn hình khi đưa thẻ không tiếp xúc cho đầu đọc; nhiệm vụ của nhân viên bảo vệ là so sánh ảnh và người mang thẻ (theo khoa học, việc này gọi là xác minh). Nhân viên bảo vệ thực hiện công việc này một cách kém cỏi - giống như bất kỳ công việc đơn điệu, thường ngày, lặp đi lặp lại nào khác.

Hệ thống nhận dạng khuôn mặt sẽ không chỉ thực hiện công việc này hiệu quả hơn nhiều mà còn ngăn chặn sự lạm dụng của an ninh.

Nhận dạng khuôn mặt trong giao thông vận tải

Trong vận tải, nhận dạng khuôn mặt có thể được sử dụng cho một số mục đích:

Tìm kiếm người mất tích
Truy tìm tội phạm bị truy nã
Trích xuất thông tin nhân khẩu học của mọi người để phục vụ tốt hơn
Đo lường sự hài lòng của mọi người từ khuôn mặt của họ
Đếm số lượng hành khách sử dụng phương tiện giao thông công cộng

Dữ liệu trực tuyến về số lượng hành khách sẽ giúp quản lý mạng lưới giao thông công cộng đô thị nhanh hơn, linh hoạt và hiệu quả hơn.

Ngoài ra, việc đếm số lượng hành khách khi so sánh dữ liệu này với số lần thanh toán sẽ có thể phát hiện ra các hành vi vi phạm quy định thanh toán tiền vé.

Nhận dạng khuôn mặt cho mục đích thanh toán tiền vé

Nhận dạng khuôn mặt cho mục đích thanh toán chi phí đi lại hiện có thể được thực hiện ở chế độ xác minh và sẽ tránh việc sử dụng trái phép vé du lịch nhiều lần, chẳng hạn như việc nhiều người sử dụng một thẻ du lịch.

Việc sử dụng khuôn mặt được công nhận làm thông tin nhận dạng hành khách duy nhất để thanh toán tiền vé tự động, ở mức độ phát triển công nghệ này, dường như chỉ có thể thực hiện được trong các mạng lưới giao thông công ty nhỏ và không hề phù hợp với giao thông đô thị công cộng đại chúng.

Theo dõi thời gian

Cho đến gần đây, việc ghi lại giờ làm việc mà không sử dụng thiết bị chặn là một giấc mơ không thể đạt được. Ngày nay đây là sự thật.
Tất nhiên, việc ghi lại thời gian làm việc là một trong những chức năng của hệ thống kiểm soát truy cập, nhưng việc ghi lại thời gian làm việc có thể được thực hiện riêng biệt, chỉ với sự trợ giúp của hệ thống nhận dạng khuôn mặt.

Một trong những lợi thế chính của việc sử dụng hệ thống nhận dạng khuôn mặt để theo dõi thời gian làm việc là không có yêu cầu về độ sạch của khuôn mặt. Tất nhiên, trong phạm vi lý do - hãy xem phần “Phá hoại”.

Ngoài ra, lợi ích của việc theo dõi thời gian làm việc bằng hệ thống nhận dạng khuôn mặt sẽ là:

Thiếu các thiết bị chặn, điều này tất nhiên làm tăng sự thoải mái
Khả năng sử dụng theo dõi thời gian một cách bí mật mà không cần thông báo cho nhân viên

Theo dõi thời gian làm việc chỉ là một trong những thước đo và nói chung, nếu tách biệt với các dữ liệu khác về hoạt động của doanh nghiệp thì nó không nói lên được gì nhiều. Nhưng với tất cả kiến thức có được, cô ấy hoàn toàn có thể hòa nhập vào việc phân tích hiệu quả hoạt động của công ty.

Cần phải giám sát lưu lượng truy cập đặc biệt chặt chẽ trong thời kỳ khủng hoảng; chính PricewaterhouseCoopers đã trực tiếp chỉ ra điều này cho chúng ta. Nếu bạn không điểm danh, bạn sẽ được nghỉ làm thêm 2 ngày, điều này bạn sẽ không biết nhưng bạn sẽ phải trả tiền. Điều này sẽ làm tăng tổn thất tài chính của bạn do nhân viên vắng mặt tại nơi làm việc lên 1,3 lần.

Nhận dạng khuôn mặt cho mục đích kế toán công nhân có thể được thực hiện dưới hai hình thức.

Máy chủ + phần mềm + camera IP tốt và tất cả những thứ này đều có giá rất cao. Tùy chọn hoàng gia là khi giờ làm việc có thể được ghi lại mà không cần thông báo cho nhân viên.

Thiết bị đầu cuối chuyên dụng là một lựa chọn khi nhân viên cần tiếp cận thiết bị đầu cuối, từ đó thực hiện thủ tục nhận dạng. Điều này chỉ có tác dụng nếu bạn đã thông báo rằng bất kỳ ai không đăng ký bằng thiết bị nhận dạng khuôn mặt sẽ không được thanh toán trong ngày. Biện pháp hành chính đơn giản này làm giảm một cách kỳ diệu các lỗi FAR và FRR xuống mức 0 tuyệt đối.

Nhận dạng khuôn mặt trong đám đông

Nói về hệ thống nhận dạng khuôn mặt, như một quy luật, trí tưởng tượng của chúng ta vẽ ra chính xác các kịch bản để xác định tội phạm trên đường phố trong thành phố. Đây là nhiệm vụ được mong muốn nhất, được yêu cầu nhiều nhất và khó khăn nhất hiện nay.

Tìm người mất tích ở Trung Quốc bằng nhận dạng khuôn mặt

Nỗi khó khăn
Ánh sáng không đồng đều (ngày, đêm, nắng gắt, tất cả đều là những điều kiện khác nhau sẽ ảnh hưởng lớn đến tỷ lệ nhận dạng khuôn mặt)
Một số lượng lớn người trong khung hình

thuận
Hiệu ứng bất ngờ
Nhận dạng khuôn mặt, mặc dù là một công nghệ đầy hứa hẹn được viết rất nhiều, nhưng lại được viết trong các ấn phẩm chuyên ngành dành cho người đam mê. Vì vậy, số người nhận thức được chỉ ở mức vi mô, trên quy mô tổng dân số. Hầu hết tội phạm đơn giản sẽ không thực hiện các hành động cản trở việc nhận dạng.

Vùng phủ sóng
Có rất nhiều camera quan sát ở hầu hết các thành phố lớn. Chính khía cạnh này sẽ có những điều chỉnh riêng đối với hoạt động của hệ thống nhận dạng khuôn mặt. Ví dụ, ở Anh, một người bị camera ghi lại khoảng 300 lần một ngày. Và đây không phải là một kỷ lục cũng không phải là giới hạn đối với camera IP giá rẻ hiện nay.

Xác định tuổi

Chúng tôi chuyển từ nhiệm vụ bảo mật sang nhiệm vụ tiếp thị. Khi họ nói về việc gia nhập ngành “Hệ thống Bảo mật” với ngành CNTT lớn, đây chính xác là ý họ - với sự trợ giúp của thiết bị trước đây được coi là chỉ có khả năng giải quyết các vấn đề bảo mật. Hôm nay tôi giải quyết rất nhiều vấn đề khác nhau không liên quan gì đến “Hệ thống bảo mật” như vậy.

Thành phần độ tuổi của du khách là thông tin vô giá đối với bất kỳ nhà tiếp thị nào và nếu bạn tin Bộ trưởng Bộ Y tế của chúng tôi, người đã tuyên bố rằng tuổi thọ trung bình có thể tăng lên 120 tuổi, mặc dù bà Skvortsova không nêu rõ điều này sẽ xảy ra ở quốc gia nào, điều này rõ ràng tiết lộ rằng cô ấy là một người thông minh. (Cá nhân tôi tin rằng ở Nga), bằng cách này hay cách khác, mức độ liên quan của nhiệm vụ xác định tuổi chắc chắn sẽ tăng lên.

Dịch vụ trực tuyến để xác định độ tuổi
Bạn có thể kiểm tra độ chính xác của việc xác định độ tuổi trên một số dịch vụ trực tuyến. Tải ảnh của bạn lên và kiểm tra.

Để xác định độ tuổi, bạn sẽ cần:

Phần mềm nhận dạng khuôn mặt www.axis.com/products/axis-demographic-identifier/

Xác định giới tính

Nếu bạn không định phân tích giới tính của những người tham gia Eurovision thì đây là một nhiệm vụ khá đơn giản đối với các hệ thống nhận dạng khuôn mặt hiện đại.

Bạn không cần phải là một nhà tiếp thị giỏi để hiểu rằng thành phần giới tính khác nhau của khách hàng đòi hỏi các chiến lược tiếp thị, quảng cáo, PR và bất kỳ chiến lược nào khác liên quan đến tương tác với khách hàng.

Chuỗi rạp chiếu phim Cinema Park và Formula Kino đã tung ra bộ sưu tập về độ tuổi và giới tính của du khách.

Bạn có thể kiểm tra mức độ chính xác của việc xác định giới tính bằng cách sử dụng các dịch vụ trực tuyến mà bạn đã quen thuộc. Tải ảnh của bạn lên và kiểm tra.

www.skybiometry.com/demo/face- detect/
www.how-old.net

Đối với mục đích xác định độ tuổi, bạn có thể sử dụng:
Phần mềm nhận dạng khuôn mặt, trong nhiều trường hợp đây là một trong những chức năng của nó.

Giải pháp sẵn có từ Axis, HikVision - Camera thông minh DVR + IP

Thụy Điển
Mã nhận dạng nhân khẩu học AXIS
https://www.axis.com/products/axis-demographic-identifier/

Đếm số lượng khách truy cập duy nhất

Vấn đề kinh điển về việc đếm số lượng khách truy cập luôn được giải quyết bằng cảm biến hồng ngoại hoặc laser, chúng chỉ hiển thị số lượng giao điểm của một đường ảo. Ví dụ, một chiếc xe đẩy sẽ đưa ra một ngã tư riêng, sử dụng chúng làm chỉ báo nhiệt độ trung bình trong bệnh viện.

Có các hệ thống phân tích video hiện đại, thường được kết hợp với các cảm biến bổ sung. Họ đã biết cách đếm những người cụ thể, nhưng một nhân viên bảo vệ hoặc một người điên ở thành phố địa phương, người đã đi đi lại lại 50 lần, có thể khiến dữ liệu trở nên gần như vô dụng.

Lần đầu tiên, nhờ hệ thống nhận dạng khuôn mặt hiện đại, các nhà tiếp thị có thể thu được dữ liệu thực sự hữu ích - số lượng khách truy cập duy nhất. Và cùng với các chỉ số về giới tính và độ tuổi, đây là số liệu Yandex cho cửa hàng của bạn.

Mô-đun phân tích khuôn mặt Trassir Face Analytics - giá 36.990 rúp
Mô-đun phân tích khuôn mặt thông minh. Chức năng:
1. đếm những người duy nhất
2. phân tích nhân khẩu học của cá nhân (giới tính, độ tuổi)
3. nhận dạng chủng tộc
4. nhận dạng các đặc điểm trên khuôn mặt (kính, mũ, ria mép, màu tóc). Chi phí xử lý 1 kênh video.

Chúng tôi sẽ sớm đăng một bài viết trên blog của mình với nội dung đánh giá về hệ thống phân tích video hiện đại dành cho các cửa hàng, nó sẽ rất hấp dẫn, hãy đăng ký để bạn không bỏ lỡ - chúng tôi có sẵn trên tất cả các nền tảng -

Cột

Nó đe dọa an ninh con người và quyền công dân, vì vậy quy định một phần nên được thay thế bằng lệnh cấm hoàn toàn. Trong khi thế giới đang bị mê hoặc bởi những lợi ích của công nghệ nhận dạng khuôn mặt thì một số chuyên gia bảo mật lại tin rằng nó mang đến tai họa lớn cho nhân loại. Giáo sư luật và khoa học máy tính Woodrow Hartzog và giáo sư triết học Evan Selinger đã đưa ra quan điểm của họ về các phương pháp kiểm soát công nghệ trong một bài báo trên Medium.

Người dân thành Troy sẽ rất vui mừng

Rất dễ bị ảnh hưởng bởi những ý tưởng có vẻ hấp dẫn nhưng thực tế là sai lầm về tương lai của nhân loại sẽ như thế nào trong một thế giới đã giải phóng toàn bộ tiềm năng tiềm ẩn của công nghệ nhận dạng khuôn mặt. Mọi người sẽ có thể nhận ngay thông tin về người lạ, họ sẽ không còn phải nhớ hàng đống mật khẩu hay sợ quên ví của mình nữa. Bạn sẽ có thể dễ dàng tìm thấy các sự kiện với một người cụ thể trong kho lưu trữ ảnh và video, nhanh chóng tìm kiếm những người mất tích hoặc tội phạm và đảm bảo an toàn cho những nơi công cộng.

Có vẻ như công nghệ chỉ mang lại lợi ích, công lý tuyệt đối sẽ ngự trị trên thế giới và những ý tưởng đáng kinh ngạc nhất của nhân loại sẽ được hiện thực hóa. Nhưng không có cơ chế giám sát nào do loài người phát minh ra nguy hiểm bằng công nghệ nhận dạng khuôn mặt.

Bị thu hút bởi tầm nhìn không tưởng này, mọi người sẽ đưa công nghệ nhận dạng khuôn mặt vào nhà và thiết bị của họ, cho phép nó chiếm vị trí trung tâm trong các khía cạnh luôn mới của cuộc sống. Điều này có nghĩa là cái bẫy đã đóng sầm lại, và sau đó sẽ có một nhận thức khó chịu rằng công nghệ này chỉ là một loại ngựa thành Troy. Công cụ áp bức lý tưởng này quá tốt để các chính phủ không sử dụng để thiết lập các biện pháp kiểm soát độc tài và các chế độ toàn diện sẽ phá hủy khái niệm về quyền riêng tư.

Con ngựa thành Troy này không được vào thành phố.

Các cuộc thảo luận hiện tại

Liên minh Tự do Dân sự Hoa Kỳ cùng với 70 tổ chức nhân quyền khác đã yêu cầu Amazon ngừng cung cấp công nghệ nhận dạng khuôn mặt cho chính phủ, đồng thời kêu gọi Quốc hội áp đặt lệnh cấm chính phủ sử dụng công nghệ này. Giới truyền thông cũng vào cuộc và bày tỏ sự quan ngại. Ví dụ, ban biên tập tờ Washington Post cho rằng Quốc hội có nghĩa vụ phải can thiệp ngay vào tình hình. Các nghị sĩ cũng có lý do chính đáng để thắc mắc: một số người trong số họ có liên quan đến phần mềm nhận dạng khuôn mặt của Amazon bởi bọn tội phạm.

Các biên tập viên của The Guardian cũng không bị bỏ rơi. Chủ tịch Microsoft Brad Smith đã yêu cầu chính phủ Hoa Kỳ quản lý công nghệ nhận dạng khuôn mặt trong một bài đăng trên blog:

“Cách đáng tin cậy duy nhất để kiểm soát việc sử dụng công nghệ của chính phủ là kiểm soát độc lập việc sử dụng công nghệ, có tính đến các trường hợp có thể xảy ra. Chúng tôi tin rằng hiện nay có nhu cầu cấp thiết về sáng kiến của chính phủ nhằm giám sát việc sử dụng hợp pháp công nghệ nhận dạng khuôn mặt, dựa trên quyết định của hội đồng chuyên gia lưỡng đảng.”

Ý kiến của lãnh đạo công ty cũng như luật hạn chế sử dụng công nghệ đều rất quan trọng. Nhưng chỉ hỗ trợ một phần và hướng dẫn bằng văn bản cẩn thận sẽ không bao giờ đủ. Luật pháp có thể mang lại lợi ích to lớn, nhưng rất có thể chúng sẽ bắt đầu được áp dụng khi công nghệ trở nên rẻ hơn và dễ sử dụng hơn nhiều. Smith chỉ ra rằng Microsoft đã kêu gọi ban hành luật quốc gia về lĩnh vực này vào năm 2005. Đã hơn chục năm trôi qua nhưng Quốc hội vẫn chưa thông qua một đạo luật nào như vậy.

Nếu công nghệ nhận dạng khuôn mặt tiếp tục được phát triển và triển khai trong cuộc sống, một cơ sở hạ tầng khổng lồ sẽ xuất hiện sẽ nhấn chìm nhân loại. Lịch sử đã chỉ ra rằng sự chú ý rộng rãi đến thành công, nỗi sợ hãi về sự bất an và cảm giác say mê về quyền lực có thể dẫn đến sự lừa dối, thay đổi giá trị doanh nghiệp và cuối cùng là lạm dụng công nghệ một cách có hệ thống.

Tương lai hạnh phúc của nhân loại chỉ có thể thực hiện được nếu công nghệ nhận dạng khuôn mặt bị cấm trước khi nó trở nên quá ăn sâu vào cuộc sống con người.

Tại sao lại có lệnh cấm?

Nhu cầu cấm hoàn toàn hệ thống nhận dạng khuôn mặt là cực kỳ cao. Nhưng một số nhà khoa học tài năng, như Judith Donat, tin rằng quan điểm này không chính xác. Họ đề xuất một chiến thuật trung lập hơn về mặt công nghệ: cấm các hành động cụ thể, cũng như xác định các giá trị và quyền cần được bảo vệ. Cách tiếp cận này có ý nghĩa hoàn hảo đối với hầu hết các công nghệ kỹ thuật số.

Nhưng không có cơ chế giám sát nào do loài người phát minh ra nguy hiểm bằng công nghệ nhận dạng khuôn mặt. Nó là phần còn thiếu của cơ sở hạ tầng giám sát con người vốn đã nguy hiểm, được phát triển vì chính phủ và doanh nghiệp tư nhân cần cơ sở hạ tầng này. Và nếu công nghệ trở nên nguy hiểm đến mức như vậy và tỷ lệ lợi ích và tác hại trở nên méo mó, thì đã đến lúc phải suy nghĩ về những điều cấm tuyệt đối. Một số loại công nghệ kỹ thuật số nguy hiểm, chẳng hạn như phần mềm gián điệp, đã bị cấm ở cấp lập pháp. Công nghệ nhận dạng khuôn mặt tiềm ẩn nhiều rủi ro lớn hơn và sẽ rất tốt nếu nhận được sự quan tâm đặc biệt về mặt pháp lý. Điều cần thiết là một lệnh cấm cụ thể dựa trên khung pháp lý mạnh mẽ, toàn diện, dựa trên giá trị và phần lớn là trung lập về công nghệ. Một hệ thống như vậy sẽ giúp tránh được các tình huống pháp lý trong đó các nhà lập pháp cố gắng bắt kịp các xu hướng công nghệ.

Việc giám sát bằng cách sử dụng hệ thống nhận dạng khuôn mặt vốn đã mang tính áp bức. Sự tồn tại của những hệ thống như vậy, thường bị che giấu khỏi tầm nhìn của con người, là vi phạm quyền tự do dân sự vì mọi người sẽ hành xử khác nếu họ nghi ngờ rằng họ đang bị theo dõi. Ngay cả những luật đảm bảo các biện pháp bảo vệ nghiêm ngặt cũng sẽ không ngăn được cảm giác ngột ngạt rằng cơ hội thể hiện bản thân của một người sẽ bị suy giảm.

Dưới đây là ví dụ về việc sử dụng sai mục đích và tác hại của công nghệ nhận dạng khuôn mặt:

sự quan tâm không cân xứng đến người da màu, các nhóm thiểu số khác và những người dễ bị tổn thương;
thay thế suy đoán vô tội bằng nguyên tắc “người chưa chứng minh được tội lỗi”;
sự lan rộng của bạo lực và tàn ác;
từ chối các quyền và cơ hội cơ bản, chẳng hạn như bảo vệ khỏi việc chính phủ tùy tiện theo dõi các hoạt động, thói quen, mối quan hệ, sở thích và suy nghĩ của một người;
“công việc” liên tục của pháp luật - như một biện pháp phòng ngừa lâu dài;
phá bỏ khái niệm lưu trữ thông tin “gần như mơ hồ”, khi dữ liệu thuộc phạm vi công cộng nhưng được lưu trữ ở nhiều nguồn khác nhau và cực kỳ khó tìm;
sự lan rộng của "chủ nghĩa tư bản giám sát".

Như nhà nghiên cứu công nghệ nhận dạng khuôn mặt Claire Garvey lưu ý, những sai sót trong đó có thể gây ra hậu quả nghiêm trọng:

“Điều gì xảy ra nếu một hệ thống như vậy thất bại? Nếu CCTV không thành công, một người vô tội sẽ bị truy đuổi, thẩm vấn hoặc thậm chí có thể bị bắt và bị buộc tội. Hoặc máy ảnh cầm tay có hệ thống nhận dạng khuôn mặt dành cho cảnh sát: nếu hệ thống chỉ vào một người được cho là có thể gây nguy hiểm cho xã hội, cảnh sát sẽ phải quyết định ngay lập tức xem có nên sử dụng vũ khí hay không. Những người vô tội có thể bị tổn hại do cảnh báo sai.”

Trong số những báo cáo khác, có hai báo cáo đề cập chi tiết đến nhiều vấn đề này: một bài báo rất có giá trị về việc sử dụng nhận dạng khuôn mặt của cơ quan thực thi pháp luật, do luật sư cấp cao Jennifer Lynch của Electronic Frontier Foundation xuất bản và một nghiên cứu của Trung tâm Quyền riêng tư & Công nghệ tại Đại học Georgetown.

Bất chấp những vấn đề được mô tả trong báo cáo, không phải ai cũng tin rằng lệnh cấm là thực sự cần thiết. Xét cho cùng, các công nghệ khác cũng gây ra mối đe dọa không kém: dữ liệu định vị địa lý, thông tin từ hồ sơ mạng xã hội, kết quả truy vấn tìm kiếm và nhiều nguồn thông tin khác về người dùng có thể được sử dụng để tạo ra bức chân dung chi tiết về họ. Nhưng nhận dạng khuôn mặt vẫn tiềm ẩn một mối nguy hiểm khác và khác biệt ngay cả khi so sánh với dữ liệu sinh trắc học: dấu vân tay, mẫu DNA hay quét võng mạc.

Các hệ thống xử lý hình ảnh khuôn mặt có năm đặc điểm riêng biệt khiến mọi lý do để cấm chúng. Thứ nhất, khuôn mặt khó che giấu hay thay đổi. Khuôn mặt không thể được mã hóa như dữ liệu trên phương tiện kỹ thuật số hoặc trong email hoặc tin nhắn văn bản. Chúng có thể được quay bằng camera từ xa và chi phí cho công nghệ cũng như lưu trữ hình ảnh trên đám mây không ngừng giảm, dẫn đến việc sử dụng ngày càng rộng rãi các hệ thống giám sát như vậy.

Thứ hai, có cơ sở dữ liệu về tên và khuôn mặt, chẳng hạn như giấy phép lái xe hoặc tài khoản mạng xã hội, có thể truy cập rất dễ dàng.

Thứ ba, không giống như các hệ thống giám sát thông thường thường yêu cầu thiết bị đắt tiền hoặc nguồn dữ liệu mới, dữ liệu đầu vào để nhận dạng khuôn mặt có ở khắp mọi nơi và xuất hiện trực tiếp từ thời điểm camera được ghi lại.

Thứ tư, một bước ngoặt. Bất kỳ cơ sở dữ liệu nào về các cá nhân để xác định các cá nhân bị bắt hoặc bị camera ghi lại đều có thể được “khớp” với bất kỳ cơ sở dữ liệu nào khác trong thời gian thực bằng cách sử dụng một vài dòng mã bằng cách kết nối với camera cảnh sát di động hoặc hệ thống CCTV. Thống đốc bang New York Andrew Cuomo đã lưu ý chính xác lý do cho sự phát triển của công nghệ nhận dạng khuôn mặt, cho rằng việc chỉ quét biển số xe ô tô có vẻ tầm thường so với khả năng của camera có công nghệ tích hợp: “Hệ thống đọc biển số xe để xác định người vi phạm, nhưng tiền phạt không phải là lợi ích lớn nhất của thiết bị này. Chúng tôi đang chuyển sang công nghệ nhận dạng khuôn mặt và giờ đây hệ thống sẽ có thể quét khuôn mặt của người lái xe và đối chiếu với cơ sở dữ liệu, điều này mở ra những góc nhìn hoàn toàn mới.”

Thứ năm, khuôn mặt, không giống như dấu vân tay, dáng đi hay hình ảnh võng mạc, là yếu tố trung tâm tạo nên danh tính của một người. Con người là trung gian giữa đời sống ảo và đời thực của một người, là cầu nối giữa các hành động mà một người thực hiện một cách ẩn danh, dưới tên mình hoặc tên người khác. Có vẻ như không cần thiết phải bảo vệ quyền riêng tư trên khuôn mặt như bất kỳ thông tin riêng tư nào khác, bởi trong cuộc sống mọi người thường không che mặt. Ngoại trừ ở những quốc gia nơi phụ nữ bắt buộc phải mặc burqa, những người che mặt sẽ bị nhìn nhận với ánh mắt nghi ngờ.

Việc đảm bảo quyền riêng tư cho khuôn mặt của một người thực sự là cần thiết bởi trước đây, con người đã phát triển các thể chế và giá trị liên quan đến việc bảo vệ thông tin riêng tư trong thời kỳ việc xác định người lạ nói chung khá khó khăn. Do đặc điểm sinh học, trí nhớ của con người có hạn và nếu không có công nghệ bổ sung, con người chỉ có thể nhớ được một số ít khuôn mặt. Và với quy mô và sự phân bổ dân số, một người sẽ không gặp nhiều người mới trong đời. Những hạn chế này đã tạo ra một loại điểm mù, khiến mọi người có nguy cơ bị lạc trong đám đông.

Các quyết định gần đây của Tòa án Tối cao Hoa Kỳ liên quan đến Tu chính án thứ tư (cấm khám xét và tịch thu bất hợp lý và yêu cầu tòa án ban hành lệnh khám xét vì lý do có thể xảy ra) cho thấy cuộc đấu tranh bảo vệ quyền riêng tư ở những nơi công cộng vẫn có liên quan. Mùa hè này, trong một phiên tòa, tòa án đã quyết định rằng dữ liệu định vị địa lý từ điện thoại di động được bảo vệ bởi Hiến pháp và thông tin mà một người muốn giữ bí mật, ngay cả khi nó được công khai, có thể được Hiến pháp bảo vệ.

Tại sao công nghệ nhận dạng khuôn mặt không phải tuân theo quy định của pháp luật

Do công nghệ nhận dạng khuôn mặt gây ra mối đe dọa lớn nên xã hội không thể phó mặc các quy định của mình cho may rủi. Lợi nhuận tiềm năng sẽ kích thích sự xuất hiện của các ý tưởng nhằm hiện thực hóa tiềm năng tối đa của công nghệ và các công ty riêng lẻ sẽ thúc đẩy lợi ích của họ theo hướng này.

Xã hội cũng không thể chờ đợi sự trỗi dậy của những người theo chủ nghĩa dân túy. Công nghệ nhận dạng khuôn mặt sẽ tiếp tục được “bán” như một phần của các ứng dụng và thiết bị mới nhất, tiên tiến nhất. Apple đã gọi Face ID là tính năng tốt nhất của iPhone mới nhất. Điều tương tự cũng xảy ra với những bản tin mang tính tư tưởng, trong đó công nghệ nhận dạng khuôn mặt được ca ngợi là giải pháp cho mọi vấn đề.

Cuối cùng, xã hội không nên phụ thuộc quá mức vào các phương pháp quản lý truyền thống. Đặc thù của công nghệ nhận dạng khuôn mặt khiến việc ngăn chặn nó trở nên khó khăn trong khuôn khổ các biện pháp xác định việc sử dụng hợp pháp và bất hợp pháp cũng như cố gắng đáp ứng tính hữu ích tiềm tàng của nó đối với xã hội và yếu tố răn đe đối với những kẻ tấn công. Đây là một trong số ít ví dụ cần đưa ra lệnh cấm hoàn toàn.

Hiện tại, có rất ít dự án kiểm soát công nghệ nhận dạng khuôn mặt và hạn chế nó lại càng ít hơn. Có luật dữ liệu sinh trắc học phù hợp ở Illinois và Texas, nhưng chúng tuân theo chiến lược quản lý thông thường yêu cầu các thực thể thu thập và sử dụng dữ liệu này phải tuân thủ một bộ quy tắc thông tin cơ bản và giao thức bảo mật. Chúng bao gồm yêu cầu phải có được sự đồng ý có hiểu biết về việc thu thập dữ liệu sinh trắc học, các giới hạn bảo mật và lưu giữ bắt buộc, cấm sử dụng dữ liệu vì lợi nhuận, hạn chế chuyển giao quyền cho bên thứ ba và các lý do hành động riêng tư trong trường hợp vi phạm các tiêu chuẩn này.

Luật nhận dạng khuôn mặt được đề xuất cũng tương tự. Ủy ban Thương mại Liên bang Hoa Kỳ khuyến nghị áp dụng cơ chế tương tự cho công nghệ: cảnh báo mọi người về việc sử dụng nó, cho họ lựa chọn và hạn chế một cách công bằng việc sử dụng dữ liệu của họ. Báo cáo của Electronic Frontier Foundation, tập trung vào việc thực thi các luật này, cũng đưa ra những đề xuất tương tự, mặc dù sâu sắc hơn. Ví dụ: tạo các quy tắc rõ ràng về việc sử dụng, phân phối và bảo mật dữ liệu; đưa ra các hạn chế về thu thập và lưu trữ dữ liệu; lệnh cấm đưa một số loại dữ liệu sinh trắc học vào một cơ sở dữ liệu; thông báo bắt buộc, kiểm tra và giám sát độc lập. Trong dự thảo luật nhận dạng khuôn mặt, Trung tâm Quyền riêng tư & Công nghệ tại Đại học Georgetown đề xuất hạn chế đáng kể quyền truy cập của chính phủ vào cơ sở dữ liệu khuôn mặt cũng như việc sử dụng công nghệ nhận dạng khuôn mặt theo thời gian thực.

Thật không may, hầu hết các yêu cầu hiện tại và đề xuất đều mang tính chất thủ tục. Và cuối cùng, chúng sẽ không ngăn được sự lan rộng của chính công nghệ và sự phát triển của cơ sở hạ tầng tương ứng. Điều đầu tiên cần lưu ý là sự sai lệch của một số giả định cơ bản về sự đồng ý, thông báo và lựa chọn tồn tại trong luật hiện hành. Sự đồng ý có hiểu biết như một cơ chế điều chỉnh việc giám sát và xử lý dữ liệu là hoàn toàn vô dụng. Ngay cả khi mọi người có toàn quyền kiểm soát dữ liệu của mình, họ vẫn không thể tận dụng tối đa lợi thế của nó.

Tuy nhiên, các nhà lập pháp và bản thân ngành công nghiệp này đang cố gắng di chuyển kim chỉ nam. Nhưng những quy định này, giống như hầu hết các quy định về quyền riêng tư trong thời đại kỹ thuật số, đều có nhiều lỗ hổng. Một số luật chỉ liên quan đến việc thu thập hoặc lưu trữ dữ liệu và không đề cập đến cách sử dụng dữ liệu đó. Một số khác chỉ áp dụng cho các công ty hoặc chính phủ và mơ hồ đến mức chúng tránh được hậu quả cho các hành động bất hợp pháp khác nhau. Và việc nhận ra những lợi ích của công nghệ nhận dạng khuôn mặt được chào đón nhiều sẽ đòi hỏi nhiều camera hơn, cơ sở hạ tầng tốt hơn và cơ sở dữ liệu rộng lớn.

Tương lai của công nghệ nhận dạng khuôn mặt

Công nghệ nhận dạng khuôn mặt mở ra khả năng vô tận trong việc theo dõi thông tin về danh tính và chuyển động của một người. Và cũng gần như ngay lập tức lưu, phân phối và phân tích nó. Sự phát triển của công nghệ này trong tương lai có thể dẫn đến việc tính bảo mật thông tin cá nhân của một người sẽ liên tục bị vi phạm. Sự thịnh vượng của nhân loại chỉ có thể đạt được nếu lệnh cấm được áp dụng đối với công nghệ nhận dạng khuôn mặt trước khi những hệ thống này trở nên quá cố thủ trong cuộc sống hàng ngày. Nếu không, mọi người sẽ chỉ quen với một thế giới mà mỗi khi họ xuất hiện ở nơi công cộng, họ sẽ tự động được nhận dạng, nhập thông tin hồ sơ và có thể được sử dụng. Trong một thế giới như vậy, những người phản đối công nghệ nhận dạng khuôn mặt sẽ bị mất uy tín, bị im lặng hoặc bị loại bỏ.

Với tần suất đáng ghen tị, các bài báo xuất hiện trên Habré nói về nhiều phương pháp nhận dạng khuôn mặt khác nhau. Chúng tôi quyết định không chỉ hỗ trợ chủ đề tuyệt vời này mà còn xuất bản tài liệu nội bộ của mình, trong đó bao gồm, nếu không phải tất cả, nhưng nhiều cách tiếp cận để nhận dạng khuôn mặt, điểm mạnh và điểm yếu của chúng. Có thể nói, nó được biên soạn bởi Andrey Gusak, kỹ sư của chúng tôi, dành cho các nhân viên trẻ của bộ phận thị giác máy, nhằm mục đích giáo dục. Hôm nay chúng tôi cung cấp nó cho tất cả những ai muốn nó. Ở cuối bài viết có một danh sách tài liệu tham khảo đầy ấn tượng dành cho những ai ham học hỏi nhất.

Vì vậy, hãy bắt đầu.
Mặc dù có rất nhiều thuật toán được trình bày, cấu trúc chung của quá trình nhận dạng khuôn mặt có thể được xác định:

Quy trình chung xử lý ảnh khuôn mặt trong quá trình nhận dạng

Ở giai đoạn đầu tiên, khuôn mặt được phát hiện và định vị trong ảnh. Ở giai đoạn nhận dạng, hình ảnh khuôn mặt được căn chỉnh (hình học và độ sáng), các đặc điểm được tính toán và nhận dạng được thực hiện trực tiếp—so sánh các đặc điểm được tính toán với các tiêu chuẩn được lưu trữ trong cơ sở dữ liệu. Sự khác biệt chính giữa tất cả các thuật toán được trình bày sẽ là việc tính toán các tính năng và so sánh các tập hợp của chúng với nhau.

1. Phương pháp so sánh linh hoạt trên đồ thị (Elastic Graph Match).

Bản chất của phương pháp này là sự kết hợp đàn hồi của các biểu đồ mô tả hình ảnh khuôn mặt. Các mặt được biểu diễn dưới dạng đồ thị với các đỉnh và cạnh có trọng số. Ở giai đoạn nhận dạng, một trong các biểu đồ - biểu đồ tham chiếu - không thay đổi, trong khi biểu đồ còn lại bị biến dạng để phù hợp nhất với biểu đồ đầu tiên. Trong các hệ thống nhận dạng như vậy, đồ thị có thể là một mạng hình chữ nhật hoặc một cấu trúc được hình thành bởi các điểm đặc trưng (nhân trắc học) của khuôn mặt.

MỘT)

Một ví dụ về cấu trúc biểu đồ để nhận dạng khuôn mặt: a) mạng thông thường b) biểu đồ dựa trên các điểm nhân trắc học của khuôn mặt.

Tại các đỉnh của biểu đồ, các giá trị của các đặc điểm được tính toán, thường sử dụng các giá trị phức tạp của bộ lọc Gabor hoặc các tập được sắp xếp của chúng - các bước sóng Gabor (mảng Gabor), được tính toán trong một số khu vực cục bộ của đỉnh của đồ thị cục bộ bằng cách kết hợp các giá trị độ sáng của pixel bằng bộ lọc Gabor.

Bộ (ngân hàng, máy bay phản lực) của bộ lọc Gabor

Ví dụ về tích chập ảnh khuôn mặt với hai bộ lọc Gabor

Các cạnh của đồ thị được tính theo khoảng cách giữa các đỉnh liền kề. Sự khác biệt (khoảng cách, đặc tính phân biệt đối xử) giữa hai đồ thị được tính bằng cách sử dụng một số hàm chi phí biến dạng có tính đến cả sự khác biệt giữa các giá trị đặc trưng được tính tại các đỉnh và mức độ biến dạng của các cạnh đồ thị.
Sự biến dạng của đồ thị xảy ra bằng cách dịch chuyển từng đỉnh của nó một khoảng cách nhất định theo các hướng nhất định so với vị trí ban đầu của nó và chọn vị trí sao cho chênh lệch giữa các giá trị của các đặc điểm (phản hồi của bộ lọc Gabor) ở đỉnh của đồ thị bị biến dạng. đồ thị và đỉnh tương ứng của đồ thị tham chiếu sẽ là tối thiểu. Thao tác này được thực hiện lần lượt cho tất cả các đỉnh của đồ thị cho đến khi đạt được tổng chênh lệch nhỏ nhất giữa các đặc điểm của đồ thị biến dạng và đồ thị tham chiếu. Giá trị của hàm chi phí biến dạng ở vị trí này của đồ thị bị biến dạng sẽ là thước đo sự khác biệt giữa ảnh khuôn mặt đầu vào và đồ thị tham chiếu. Quy trình biến dạng “thư giãn” này phải được thực hiện cho tất cả các cá thể tham chiếu có trong cơ sở dữ liệu hệ thống. Kết quả nhận dạng của hệ thống là chuẩn có giá trị tốt nhất của hàm giá biến dạng.

Một ví dụ về biến dạng đồ thị ở dạng mạng đều

Một số ấn phẩm cho thấy hiệu quả nhận dạng 95-97% ngay cả khi có nhiều biểu hiện cảm xúc khác nhau và thay đổi góc mặt lên tới 15 độ. Tuy nhiên, các nhà phát triển hệ thống so sánh đàn hồi trên đồ thị cho rằng phương pháp này có chi phí tính toán cao. Ví dụ: so sánh một hình ảnh khuôn mặt đầu vào với 87 hình ảnh tham chiếu mất khoảng 25 giây khi chạy trên một máy tính song song với 23 bộ chuyển đổi (Lưu ý: xuất bản năm 1993). Các ấn phẩm khác về chủ đề này không cho biết thời gian hoặc nói rằng nó dài.

Sai sót:độ phức tạp tính toán cao của thủ tục nhận dạng. Công nghệ thấp trong việc ghi nhớ các tiêu chuẩn mới. Sự phụ thuộc tuyến tính của thời gian hoạt động vào kích thước của cơ sở dữ liệu khuôn mặt.

2. Mạng lưới thần kinh

Hiện nay, có khoảng chục loại mạng lưới thần kinh (NN). Một trong những tùy chọn được sử dụng rộng rãi nhất là mạng được xây dựng trên perceptron nhiều lớp, cho phép bạn phân loại hình ảnh/tín hiệu đầu vào theo cấu hình/huấn luyện sơ bộ của mạng.
Mạng lưới thần kinh được đào tạo trên một tập hợp các ví dụ đào tạo. Bản chất của việc đào tạo là điều chỉnh trọng số của các kết nối nơ-ron nội tạng trong quá trình giải quyết vấn đề tối ưu hóa bằng phương pháp giảm độ dốc. Trong quá trình đào tạo NN, các tính năng chính được trích xuất tự động, tầm quan trọng của chúng được xác định và mối quan hệ giữa chúng được xây dựng. Giả định rằng một NN được đào tạo sẽ có thể áp dụng kinh nghiệm thu được trong quá trình đào tạo vào các hình ảnh chưa biết do khả năng khái quát hóa của nó.
Các kết quả tốt nhất trong lĩnh vực nhận dạng khuôn mặt (theo kết quả phân tích của các ấn phẩm) được thể hiện bởi Mạng thần kinh chuyển đổi hoặc mạng thần kinh tích chập (sau đây gọi tắt là CNN), là sự phát triển hợp lý các ý tưởng của các kiến trúc mạng thần kinh như vậy như cognitron và neocognitron. Thành công là nhờ khả năng tính đến cấu trúc liên kết hai chiều của hình ảnh, trái ngược với nhận thức đa lớp.
Các đặc điểm nổi bật của CNN là các trường thụ thể cục bộ (cung cấp khả năng kết nối hai chiều cục bộ của các nơ-ron), trọng số chung (cung cấp khả năng phát hiện các tính năng nhất định ở bất kỳ đâu trong hình ảnh) và tổ chức phân cấp với lấy mẫu không gian (lấy mẫu con không gian). Nhờ những đổi mới này, CNN cung cấp khả năng chống lại một phần những thay đổi về quy mô, sự dịch chuyển, góc quay, những thay đổi về phối cảnh và những biến dạng khác.

Sơ đồ minh họa kiến trúc mạng nơ-ron tích chập

Thử nghiệm CNN trên cơ sở dữ liệu ORL chứa hình ảnh các khuôn mặt có những thay đổi nhỏ về ánh sáng, tỷ lệ, xoay không gian, vị trí và nhiều cảm xúc khác nhau cho thấy độ chính xác nhận dạng là 96%.
CNN đã nhận được sự phát triển của mình trong quá trình phát triển DeepFace, được mua lại bởi
Facebook nhận dạng khuôn mặt của người dùng mạng xã hội của mình. Tất cả các đặc điểm kiến trúc đều khép kín.

DeepFace hoạt động như thế nào

Nhược điểm của mạng nơ-ron: việc thêm một người tham chiếu mới vào cơ sở dữ liệu yêu cầu phải đào tạo lại toàn bộ mạng trên toàn bộ tập hợp hiện có (một quy trình khá dài, tùy thuộc vào cỡ mẫu từ 1 giờ đến vài ngày). Các bài toán mang tính chất toán học gắn liền với quá trình huấn luyện: đạt tới mức tối ưu cục bộ, chọn bước tối ưu hóa tối ưu, huấn luyện lại, v.v. Giai đoạn lựa chọn kiến trúc mạng (số lượng nơ-ron, lớp, tính chất của kết nối) rất khó hình thức hóa. Tóm tắt tất cả những điều trên, chúng ta có thể kết luận rằng mạng lưới thần kinh là một “hộp đen” với những kết quả khó diễn giải.

3. Mô hình Markov ẩn (HMM, HMM)

Một trong những phương pháp thống kê để nhận dạng khuôn mặt là các mô hình Markov ẩn thời gian rời rạc (HMM). HMM sử dụng các đặc tính thống kê của tín hiệu và trực tiếp tính đến các đặc điểm không gian của chúng. Các thành phần của mô hình là: tập hợp các trạng thái ẩn, tập hợp các trạng thái được quan sát, ma trận xác suất chuyển tiếp, xác suất ban đầu của các trạng thái. Mỗi người đều có mô hình Markov riêng. Khi nhận dạng một đối tượng, các mô hình Markov được tạo cho một cơ sở đối tượng nhất định sẽ được kiểm tra và xác suất quan sát được tối đa được tìm kiếm để chuỗi quan sát cho một đối tượng nhất định được tạo ra bởi mô hình tương ứng.
Cho đến nay, vẫn chưa thể tìm thấy một ví dụ nào về ứng dụng thương mại của HMM để nhận dạng khuôn mặt.

Sai sót:
- cần lựa chọn các tham số mô hình cho từng cơ sở dữ liệu;
- HMM không có khả năng phân biệt, tức là thuật toán học chỉ tối đa hóa phản hồi của từng ảnh đối với mô hình của nó chứ không giảm thiểu phản hồi đối với các mô hình khác.

4. Phân tích thành phần chính (PCA)

Một trong những phương pháp nổi tiếng và được phát triển tốt nhất là phân tích thành phần chính (PCA), dựa trên phép biến đổi Karhunen-Loev.
Ban đầu, phương pháp thành phần chính bắt đầu được sử dụng trong thống kê để giảm không gian đặc trưng mà không làm mất thông tin đáng kể. Trong nhiệm vụ nhận dạng khuôn mặt, nó được sử dụng chủ yếu để thể hiện hình ảnh khuôn mặt bằng vectơ có chiều thấp (các thành phần chính), sau đó được so sánh với vectơ tham chiếu được lưu trữ trong cơ sở dữ liệu.
Mục tiêu chính của phương pháp thành phần chính là giảm đáng kể kích thước của không gian đặc trưng để nó mô tả các hình ảnh “điển hình” của nhiều cá nhân một cách tốt nhất có thể. Sử dụng phương pháp này, có thể xác định các biến thể khác nhau trong tập huấn luyện của ảnh khuôn mặt và mô tả sự biến đổi này trên cơ sở một số vectơ trực giao, được gọi là các mặt riêng.

Tập hợp các vectơ riêng thu được một lần trên tập huấn luyện ảnh khuôn mặt được sử dụng để mã hóa tất cả các ảnh khuôn mặt khác, được biểu diễn bằng sự kết hợp có trọng số của các vectơ riêng này. Bằng cách sử dụng một số lượng vectơ riêng hạn chế, có thể thu được một xấp xỉ nén cho hình ảnh khuôn mặt đầu vào, sau đó có thể được lưu trữ trong cơ sở dữ liệu dưới dạng vectơ hệ số, cũng đóng vai trò là khóa tìm kiếm trong cơ sở dữ liệu khuôn mặt.

Bản chất của phương pháp thành phần chính như sau. Đầu tiên, toàn bộ tập huấn luyện các khuôn mặt được chuyển đổi thành một ma trận dữ liệu chung, trong đó mỗi hàng đại diện cho một thể hiện của hình ảnh khuôn mặt được phân tách thành một hàng. Tất cả các khuôn mặt trong tập huấn luyện phải được giảm về cùng kích thước và có biểu đồ chuẩn hóa.

Chuyển đổi tập huấn luyện các khuôn mặt thành một ma trận tổng quát X

Sau đó, dữ liệu được chuẩn hóa và các hàng được giảm xuống 0 giá trị trung bình và 1 phương sai, đồng thời tính toán ma trận hiệp phương sai. Đối với ma trận hiệp phương sai thu được, bài toán xác định giá trị riêng và vectơ riêng tương ứng (mặt riêng) được giải quyết. Tiếp theo, các vectơ riêng được sắp xếp theo thứ tự giá trị riêng giảm dần và chỉ còn lại k vectơ đầu tiên theo quy tắc:

Thuật toán PCA

Một ví dụ về 10 vectơ riêng (mặt riêng) đầu tiên thu được từ tập các khuôn mặt đã được huấn luyện

= 0.956*-1.842*+0.046 …

Một ví dụ về xây dựng (tổng hợp) khuôn mặt người bằng cách sử dụng kết hợp các khuôn mặt riêng và các thành phần chính

Nguyên tắc chọn cơ sở từ vectơ riêng tốt nhất đầu tiên

Một ví dụ về ánh xạ một khuôn mặt vào không gian số liệu ba chiều thu được từ ba mặt riêng và nhận dạng thêm

Phương pháp thành phần chính đã được chứng minh là có hiệu quả trong ứng dụng thực tế. Tuy nhiên, trong trường hợp hình ảnh khuôn mặt có những thay đổi đáng kể về độ sáng hoặc nét mặt, hiệu quả của phương pháp sẽ giảm đáng kể. Vấn đề là PCA chọn một không gian con với mục tiêu tối đa hóa tính gần đúng của tập dữ liệu đầu vào và không phân biệt đối xử giữa các lớp khuôn mặt.

Một giải pháp cho vấn đề này đã được đề xuất bằng cách sử dụng phân biệt tuyến tính của Fisher (trong tài liệu có tên “Eigen-Fisher”, “Fisherface”, LDA được tìm thấy). LDA chọn không gian con tuyến tính tối đa hóa tỷ lệ:

Ở đâu

Ma trận phân tán giữa các lớp và

Ma trận phân tán nội lớp; m – số lớp trong cơ sở dữ liệu.

LDA tìm kiếm một phép chiếu dữ liệu trong đó các lớp có thể phân tách tuyến tính tối đa (xem hình bên dưới). Để so sánh, PCA tìm kiếm phép chiếu dữ liệu giúp tối đa hóa mức độ lan truyền trên toàn bộ cơ sở dữ liệu khuôn mặt (bỏ qua các lớp). Theo kết quả thử nghiệm trong điều kiện bể mạnh và đổ bóng đáy ảnh khuôn mặt, Fisherface cho hiệu quả 95% so với 53% của Eigenface.

Sự khác biệt cơ bản giữa việc hình thành các phép chiếu PCA và LDA

Sự khác biệt giữa PCA và LDA

5. Mô hình ngoại hình hoạt động (AAM) và Mô hình hình dạng hoạt động (ASM) ()

Mô hình xuất hiện tích cực (AAM)
Mô hình hiển thị hoạt động (AAM) là mô hình thống kê của hình ảnh có thể được điều chỉnh thành hình ảnh thực thông qua nhiều loại biến dạng khác nhau. Loại mô hình này trong phiên bản hai chiều được Tim Coots và Chris Taylor đề xuất vào năm 1998. Các mô hình ngoại hình tích cực ban đầu được sử dụng để ước tính các tham số của hình ảnh khuôn mặt.
Mô hình hiển thị hoạt động chứa hai loại tham số: tham số liên quan đến hình dạng (tham số hình dạng) và tham số liên quan đến mô hình thống kê về pixel hoặc kết cấu của hình ảnh (tham số ngoại hình). Trước khi sử dụng, mô hình phải được huấn luyện trên một tập hợp các hình ảnh được gắn nhãn trước. Việc đánh dấu hình ảnh được thực hiện thủ công. Mỗi dấu có một số riêng và xác định một điểm đặc trưng mà người mẫu sẽ phải tìm trong khi thích ứng với hình ảnh mới.

Một ví dụ về đánh dấu hình ảnh khuôn mặt từ 68 điểm tạo thành hình AAM.

Quy trình đào tạo AAM bắt đầu bằng việc chuẩn hóa hình dạng trong các hình ảnh được gắn nhãn để bù đắp cho sự khác biệt về tỷ lệ, độ nghiêng và độ lệch. Với mục đích này, cái gọi là phân tích Procrustes tổng quát được sử dụng.

Tọa độ các điểm hình dạng khuôn mặt trước và sau khi chuẩn hóa

Từ toàn bộ tập hợp các điểm chuẩn hóa, các thành phần chính sau đó được trích xuất bằng phương pháp PCA.

Mô hình hình dạng AAM bao gồm một mạng lưới tam giác s0 và tổ hợp tuyến tính của các chuyển vị si so với s0

Tiếp theo, một ma trận được hình thành từ các pixel bên trong các hình tam giác được tạo thành bởi các điểm hình dạng, sao cho mỗi cột của nó chứa các giá trị pixel của kết cấu tương ứng. Điều đáng chú ý là kết cấu được sử dụng để đào tạo có thể là một kênh (thang độ xám) hoặc đa kênh (ví dụ: không gian màu RGB hoặc các loại khác). Trong trường hợp kết cấu đa kênh, vectơ pixel được tạo riêng cho từng kênh và sau đó chúng được nối với nhau. Sau khi tìm được các thành phần chính của ma trận kết cấu, mô hình AAM được coi là đã huấn luyện.

Mô hình xuất hiện AAM bao gồm giao diện cơ sở A0 được xác định bởi các pixel trong mạng cơ sở s0 và tổ hợp tuyến tính của độ lệch Ai so với A0

Ví dụ về khởi tạo AAM. Vectơ tham số hình dạng
p=(p_1,p_2,〖…,p〗_m)^T=(-54,10,-9.1,…)^T được dùng để tổng hợp mô hình hình dạng s và vectơ tham số λ=(λ_1,λ_2 ,〖…, λ〗_m)^T=(3559,351,-256,…)^T để tổng hợp hình dáng bên ngoài của mô hình. Mô hình khuôn mặt cuối cùng 〖M(W(x;p))〗^ thu được dưới dạng kết hợp của hai mô hình - hình dạng và diện mạo.

Việc điều chỉnh mô hình cho một hình ảnh khuôn mặt cụ thể được thực hiện trong quá trình giải quyết vấn đề tối ưu hóa, bản chất của vấn đề này là giảm thiểu chức năng

Sử dụng phương pháp giảm độ dốc. Các tham số mô hình tìm thấy trong trường hợp này sẽ phản ánh vị trí của mô hình trong một hình ảnh cụ thể.

Một ví dụ về việc điều chỉnh mô hình cho một hình ảnh cụ thể trong 20 lần lặp của quy trình giảm độ dốc.

Sử dụng AAM, bạn có thể mô hình hóa hình ảnh của các vật thể chịu biến dạng cứng và không cứng. AAM bao gồm một tập hợp các tham số, một số trong đó biểu thị hình dạng của khuôn mặt, phần còn lại chỉ định kết cấu của nó. Biến dạng thường được hiểu là một phép biến đổi hình học dưới dạng một tổ hợp dịch chuyển, xoay và chia tỷ lệ. Khi giải quyết vấn đề định vị khuôn mặt trong một hình ảnh, việc tìm kiếm các tham số (vị trí, hình dạng, kết cấu) của AAM đại diện cho hình ảnh tổng hợp gần nhất với hình ảnh được quan sát được thực hiện. Dựa trên mức độ gần của AAM với hình ảnh vừa vặn, quyết định có được khuôn mặt hay không được đưa ra.

Mô hình hình dạng hoạt động (ASM)

Bản chất của phương pháp ASM là tính đến mối quan hệ thống kê giữa vị trí của các điểm nhân trắc. Dựa trên mẫu hình ảnh khuôn mặt có sẵn được chụp từ phía trước. Trong ảnh, chuyên gia đánh dấu vị trí các điểm nhân trắc. Trong mỗi hình ảnh, các điểm được đánh số theo cùng thứ tự.

Ví dụ về biểu diễn hình dạng khuôn mặt sử dụng 68 điểm

Để đưa tọa độ trong tất cả các hình ảnh vào một hệ thống duy nhất, cái gọi là. phân tích Procrustes tổng quát, nhờ đó tất cả các điểm được đưa về cùng một tỷ lệ và được căn giữa. Tiếp theo, hình dạng trung bình và ma trận hiệp phương sai được tính cho toàn bộ tập hợp hình ảnh. Dựa trên ma trận hiệp phương sai, các vectơ riêng được tính toán và sau đó sắp xếp theo thứ tự giảm dần của các giá trị riêng tương ứng của chúng. Mô hình ASM được xác định bởi ma trận Φ và vectơ hình dạng trung bình ̅.
Sau đó, bất kỳ hình dạng nào cũng có thể được mô tả bằng mô hình và các tham số:

Việc bản địa hóa mô hình ASM trên một hình ảnh mới không có trong tập huấn luyện được thực hiện trong quá trình giải quyết vấn đề tối ưu hóa.

A B C D)
Minh họa quá trình bản địa hóa mô hình ASM trên một hình ảnh cụ thể: a) vị trí ban đầu b) sau 5 lần lặp c) sau 10 lần lặp d) mô hình đã hội tụ

Tuy nhiên, mục tiêu chính của AAM và ASM không phải là nhận dạng khuôn mặt mà là định vị chính xác khuôn mặt và các điểm nhân trắc học trong ảnh để xử lý tiếp.

Trong hầu hết tất cả các thuật toán, bước bắt buộc trước khi phân loại là căn chỉnh, có nghĩa là căn chỉnh hình ảnh khuôn mặt ở vị trí phía trước so với máy ảnh hoặc đưa một tập hợp các khuôn mặt (ví dụ: trong tập huấn luyện để huấn luyện bộ phân loại) đến một hệ tọa độ đơn. Để thực hiện giai đoạn này, cần xác định các điểm nhân trắc học đặc trưng của tất cả các khuôn mặt trên ảnh - thường là trung tâm của đồng tử hoặc khóe mắt. Các nhà nghiên cứu khác nhau xác định các nhóm điểm khác nhau như vậy. Để giảm chi phí tính toán cho hệ thống thời gian thực, các nhà phát triển phân bổ không quá 10 điểm như vậy.

Các mô hình AAM và ASM được thiết kế chính xác để định vị chính xác các điểm nhân trắc học này trong hình ảnh khuôn mặt.

6. Các vấn đề chính liên quan đến sự phát triển của hệ thống nhận dạng khuôn mặt

Vấn đề về ánh sáng

Vấn đề về vị trí đầu (xét cho cùng, khuôn mặt là một vật thể 3D).

Để đánh giá tính hiệu quả của các thuật toán nhận dạng khuôn mặt được đề xuất, DARPA và Phòng thí nghiệm Nghiên cứu Quân đội Hoa Kỳ đã phát triển chương trình FERET (công nghệ nhận dạng khuôn mặt).

Các thuật toán dựa trên sự so sánh linh hoạt trên đồ thị và các sửa đổi khác nhau của phương pháp thành phần chính (PCA) đã tham gia vào các thử nghiệm quy mô lớn của chương trình FERET. Hiệu quả của tất cả các thuật toán là gần như nhau. Về vấn đề này, rất khó hoặc thậm chí không thể phân biệt rõ ràng giữa chúng (đặc biệt nếu ngày kiểm tra nhất quán). Đối với các hình ảnh chính diện được chụp trong cùng một ngày, độ chính xác nhận dạng có thể chấp nhận được thường là 95%. Đối với hình ảnh được chụp bằng các thiết bị khác nhau và trong các điều kiện ánh sáng khác nhau, độ chính xác thường giảm xuống 80%. Đối với các hình ảnh được chụp cách nhau một năm, độ chính xác nhận dạng là khoảng 50%. Điều đáng chú ý là thậm chí 50 phần trăm cũng là độ chính xác cao hơn mức có thể chấp nhận được đối với một hệ thống thuộc loại này.

Hàng năm, FERET xuất bản một báo cáo thử nghiệm so sánh về các hệ thống nhận dạng khuôn mặt tiên tiến dựa trên hơn một triệu khuôn mặt. Thật không may, các báo cáo mới nhất không tiết lộ nguyên tắc xây dựng hệ thống nhận dạng mà chỉ công bố kết quả hoạt động của hệ thống thương mại. Ngày nay, hệ thống dẫn đầu là hệ thống NeoFace do NEC phát triển.

Danh sách tài liệu tham khảo (Google ở link đầu tiên)

1. Nhận dạng khuôn mặt dựa trên hình ảnh - Vấn đề và phương pháp
2. Nhận diện khuôn mặt Khảo sát.pdf
3. Nhận dạng khuôn mặt Một khảo sát văn học
4. Khảo sát kỹ thuật nhận dạng khuôn mặt
5. Khảo sát nhận diện, trích xuất và nhận dạng khuôn mặt
6. Rà soát các phương pháp nhận dạng người dựa trên hình ảnh khuôn mặt
7. Phương pháp nhận dạng một người từ ảnh khuôn mặt
8. Phân tích so sánh các thuật toán nhận dạng khuôn mặt
9. Kỹ thuật nhận dạng khuôn mặt
10. Về một cách tiếp cận để định vị các điểm nhân trắc.
11. Nhận dạng khuôn mặt trong ảnh nhóm bằng thuật toán phân đoạn
12. Báo cáo công trình nghiên cứu giai đoạn 2 về nhận diện khuôn mặt
13. Nhận dạng khuôn mặt bằng cách so khớp biểu đồ đàn hồi
14. Thuật toán nhận dạng một người từ một bức ảnh dựa trên các phép biến đổi hình học. Luận án.
15. Nhận dạng đối tượng bất biến trong kiến trúc liên kết động
16. Nhận dạng khuôn mặt bằng cách sử dụng mô hình hình dạng hoạt động, bản vá cục bộ và máy vectơ hỗ trợ
17. Nhận dạng khuôn mặt bằng cách sử dụng các mô hình ngoại hình tích cực
18. Các mô hình ngoại hình tích cực để nhận dạng khuôn mặt
19. Căn chỉnh khuôn mặt bằng mô hình hình dạng hoạt động và máy vectơ hỗ trợ
20. Mô hình hình dạng tích cực - Đào tạo và ứng dụng
21. Khuôn mặt của Fisher Vector trong tự nhiên
22. Mặt riêng vs. Nhận dạng Fisherfaces bằng cách sử dụng phép chiếu tuyến tính cụ thể của lớp
23. Mặt riêng và mặt cá
24. Giảm kích thước
25. Hướng dẫn của ICCV 2011 về Đăng ký biến dạng dựa trên bộ phận
26. Mô hình cục bộ ràng buộc để căn chỉnh khuôn mặt, Hướng dẫn
27. Bạn là ai – Học cách phân loại cụ thể từng người từ video
28. Nhận dạng con người từ hình ảnh khuôn mặt bằng phương pháp mạng lưới thần kinh
29. Nhận dạng khuôn mặt Một phương pháp tiếp cận mạng lưới thần kinh tích chập
30. Nhận dạng khuôn mặt bằng cách sử dụng Mạng thần kinh chuyển đổi và phân loại logistic đơn giản
31. Phân tích hình ảnh khuôn mặt với mạng nơ-ron tích chập
32. Phương pháp nhận dạng khuôn mặt dựa trên quy trình Markov ẩn. tác giả-ferat
33. Ứng dụng mô hình Markov ẩn trong nhận dạng khuôn mặt
34. Nhận diện và nhận dạng khuôn mặt bằng mô hình Markovs ẩn
35. Nhận dạng khuôn mặt với GNU Octave-MATLAB
36. Nhận dạng khuôn mặt bằng Python
37. Nhận dạng khuôn mặt 3D nhân trắc học
38. Nhận dạng khuôn mặt 3D
39. Nhận dạng khuôn mặt dựa trên việc lắp mô hình có thể biến hình 3D
40. Nhận dạng khuôn mặt
41. Nhận dạng khuôn mặt mạnh mẽ thông qua biểu diễn thưa thớt
42. Phương pháp đánh giá FERET cho thuật toán nhận dạng khuôn mặt
43. Tìm kiếm khuôn mặt trong bộ sưu tập ảnh lịch sử điện tử
44. Thiết kế, triển khai và đánh giá hệ thống thị giác phần cứng dành riêng cho nhận dạng khuôn mặt theo thời gian thực
45. Giới thiệu về Vấn đề Thử thách Nhận dạng Khuôn mặt Tốt, Xấu và Xấu
46. Nghiên cứu phát triển các phương pháp nhận diện khuôn mặt người trong ảnh kỹ thuật số. Bằng cấp
47. DeepFace Thu hẹp khoảng cách về hiệu suất ở cấp độ con người trong xác minh khuôn mặt
48. Giảm bớt việc đặt tên tự động cho các nhân vật trong video truyền hình
49. Hướng tới một hệ thống nhận dạng khuôn mặt thực tế Sự liên kết và chiếu sáng mạnh mẽ bằng cách thể hiện thưa thớt
50. Thuật toán nhận diện khuôn mặt người để giải các bài toán ứng dụng phân tích và xử lý ảnh
51. Phát hiện và định vị khuôn mặt trong ảnh
52. Modo Viola-Jones đã được sửa đổi
53. Phát triển và phân tích các thuật toán phát hiện và phân loại đối tượng dựa trên phương pháp học máy
54. Tổng quan về Thử thách nhận dạng khuôn mặt lớn
55. Kiểm tra nhà cung cấp nhận dạng khuôn mặt (FRVT)
56. Về hiệu quả của việc sử dụng thuật toán SURF trong nhiệm vụ nhận dạng khuôn mặt Bước đầu tiên trong quy trình của chúng tôi là phát hiện khuôn mặt. Rõ ràng là bạn cần phải tách biệt tất cả các khuôn mặt trong một bức ảnh trước khi cố gắng nhận dạng chúng!

Nếu bạn đã sử dụng bất kỳ tính năng chụp ảnh nào trong 10 năm qua, bạn có thể đã thấy hoạt động của tính năng nhận diện khuôn mặt:

Nhận diện khuôn mặt là một điều tuyệt vời cho máy ảnh. Nếu máy ảnh có thể tự động phát hiện khuôn mặt, bạn có thể chắc chắn rằng tất cả các khuôn mặt sẽ được lấy nét trước khi chụp ảnh. Nhưng chúng tôi sẽ sử dụng điều này cho mục đích khác - tìm kiếm các vùng hình ảnh cần được chuyển sang giai đoạn tiếp theo trong quy trình của chúng tôi.

Nhận diện khuôn mặt đã trở thành xu hướng chủ đạo vào đầu những năm 2000 khi Paul Viola và Michael Jones phát minh ra cách phát hiện khuôn mặt đủ nhanh để hoạt động trên các máy ảnh giá rẻ. Tuy nhiên, bây giờ có nhiều giải pháp đáng tin cậy hơn. Chúng ta sẽ sử dụng một phương pháp được khám phá vào năm 2005 - biểu đồ của các gradient định hướng (nói tóm lại, LẤY QUÁ PHẦN).

Để phát hiện khuôn mặt trong một hình ảnh, chúng ta sẽ làm cho hình ảnh của mình có màu đen và trắng, bởi vì... Dữ liệu màu không cần thiết để nhận diện khuôn mặt:

Sau đó, chúng ta sẽ xem xét từng pixel riêng lẻ trong hình ảnh của mình. Đối với mỗi pixel riêng lẻ, môi trường xung quanh ngay lập tức của nó cần được xem xét:

Mục tiêu của chúng tôi là làm nổi bật độ tối của pixel hiện tại so với các pixel liền kề với nó. Sau đó vẽ một mũi tên chỉ hướng làm cho hình ảnh trở nên tối hơn:

Khi nhìn vào pixel đơn lẻ này và các pixel lân cận của nó, hình ảnh sẽ tối dần về phía bên phải.

Nếu bạn lặp lại quá trình này cho từng pixel trong ảnh thì cuối cùng mỗi pixel sẽ được thay thế bằng một mũi tên. Những mũi tên này được gọi dốc và chúng hiển thị luồng từ sáng sang tối trên toàn bộ hình ảnh:

Kết quả có vẻ ngẫu nhiên, nhưng có lý do rất chính đáng để thay thế pixel bằng độ dốc. Khi chúng ta phân tích trực tiếp các pixel, hình ảnh tối và sáng của cùng một người sẽ có giá trị cường độ pixel rất khác nhau. Nhưng nếu chỉ xem xét phương hướng thay đổi về độ sáng, cả hình ảnh tối và sáng sẽ có diện mạo giống hệt nhau. Điều này làm cho việc giải quyết vấn đề dễ dàng hơn nhiều!

Nhưng việc lưu gradient cho từng pixel riêng lẻ mang lại cho chúng ta một phương pháp chứa quá nhiều chi tiết. Cuối cùng, chúng ta không nhìn thấy rừng vì cây. Sẽ tốt hơn nếu chúng ta có thể đơn giản nhìn thấy luồng sáng/tối bên dưới ở mức cao hơn, từ đó nhìn vào cấu trúc cơ bản của hình ảnh.

Để làm điều này, chúng tôi chia hình ảnh thành các ô vuông nhỏ, mỗi ô có kích thước 16x16 pixel. Trong mỗi ô vuông, hãy đếm xem có bao nhiêu mũi tên chuyển màu hiển thị theo từng hướng chính (tức là có bao nhiêu mũi tên hướng lên, hướng lên phải, sang phải, v.v.). Sau đó, hình vuông được đề cập sẽ được thay thế trong ảnh bằng một mũi tên có hướng chiếm ưu thế trong hình vuông đó.

Kết quả cuối cùng là chúng ta biến ảnh gốc thành một hình biểu diễn rất đơn giản thể hiện cấu trúc cơ bản của khuôn mặt ở dạng đơn giản:

Hình ảnh gốc được chuyển đổi thành biểu diễn HOG hiển thị các đặc điểm chính của hình ảnh bất kể độ sáng của nó.

Để phát hiện các khuôn mặt trong hình ảnh HOG này, tất cả những gì chúng ta phải làm là tìm phần hình ảnh giống nhất với cấu trúc HOG đã biết thu được từ nhóm khuôn mặt được sử dụng để huấn luyện:

Sử dụng phương pháp này, bạn có thể dễ dàng tìm thấy khuôn mặt trong bất kỳ hình ảnh nào:

Nếu bạn muốn tự mình thực hiện bước này bằng Python và dlib, có một chương trình chỉ ra cách tạo và xem các biểu diễn hình ảnh HOG.

Bước 2: Định vị và hiển thị khuôn mặt

Vì vậy, chúng tôi đã chọn các khuôn mặt trong hình ảnh của mình. Nhưng bây giờ có một vấn đề: cùng một khuôn mặt, nhìn từ các hướng khác nhau, trông hoàn toàn khác với máy tính:

Mọi người có thể dễ dàng nhận thấy cả hai hình ảnh đều là của nam diễn viên Will Ferrell nhưng máy tính sẽ coi họ như hai người khác nhau.

Để tính đến điều này, chúng ta hãy thử biến đổi từng hình ảnh sao cho mắt và môi luôn ở cùng một vị trí trong ảnh. Việc so sánh các khuôn mặt sẽ được đơn giản hóa rất nhiều trong các bước sau.

Để làm điều này, chúng tôi sử dụng một thuật toán gọi là "đánh giá điểm nhân trắc học". Có nhiều cách để thực hiện việc này nhưng chúng tôi sẽ sử dụng phương pháp do Vahid Kazemi và Josephine Sullivan đề xuất vào năm 2014.

Ý tưởng cơ bản là xác định được 68 điểm cụ thể ( điểm) hiện diện trên mọi khuôn mặt - phần nhô ra của cằm, mép ngoài của mỗi mắt, mép trong của mỗi lông mày, v.v. Sau đó, thuật toán học của máy được cấu hình để tìm kiếm 68 điểm cụ thể trên mỗi khuôn mặt:

Chúng tôi đặt 68 điểm nhân trắc học trên mỗi khuôn mặt

Dưới đây là kết quả của việc đặt 68 điểm nhân trắc học trên ảnh thử nghiệm của chúng tôi:

MẸO CHUYÊN NGHIỆP DÀNH CHO NGƯỜI MỚI: Bạn có thể sử dụng phương pháp tương tự này để nhập phiên bản bộ lọc khuôn mặt 3D thời gian thực của riêng bạn vào Snapchat!

Bây giờ chúng ta đã biết mắt và miệng ở đâu, chúng ta chỉ cần xoay, chia tỷ lệ và xoay hình ảnh sao cho mắt và miệng ở giữa tốt nhất có thể. Chúng tôi sẽ không đưa ra bất kỳ biến dạng 3D bất thường nào vì chúng có thể làm biến dạng hình ảnh. Chúng ta sẽ chỉ thực hiện các phép biến đổi hình ảnh cơ bản, chẳng hạn như xoay và chia tỷ lệ, để giữ cho các đường thẳng song song (được gọi là các phép biến đổi affine):

Bây giờ, dù xoay khuôn mặt như thế nào, chúng ta cũng có thể căn giữa mắt và miệng sao cho chúng gần giống nhau trong ảnh. Điều này sẽ làm cho độ chính xác của bước tiếp theo của chúng tôi cao hơn nhiều.

Nếu bạn muốn tự mình thử bước này bằng Python và dlib, thì có một chương trình tìm điểm nhân trắc học và chương trình chuyển đổi hình ảnh dựa trên các điểm đó.

Bước 3: Mã hóa khuôn mặt

Bây giờ chúng ta đi đến cốt lõi của vấn đề - nhận dạng khuôn mặt. Đây là nơi vui vẻ bắt đầu!

Cách tiếp cận đơn giản nhất để nhận dạng khuôn mặt là so sánh trực tiếp khuôn mặt chưa xác định được phát hiện ở bước 2 với tất cả các khuôn mặt đã được gắn nhãn. Nếu chúng ta tìm thấy một khuôn mặt đã được đánh dấu rất giống với khuôn mặt mà chúng ta chưa biết, thì điều này có nghĩa là chúng ta đang giao dịch với cùng một người. Nghe có vẻ là một ý tưởng rất hay phải không?

Trên thực tế, có một vấn đề lớn với cách tiếp cận này. Một trang web như Facebook, với hàng tỷ người dùng và hàng nghìn tỷ bức ảnh, không thể duyệt qua từng khuôn mặt được gắn thẻ trước đó để so sánh với từng bức ảnh mới được tải lên. Nó sẽ mất quá nhiều thời gian. Chúng ta cần nhận dạng khuôn mặt tính bằng mili giây chứ không phải hàng giờ.

Chúng ta cần học cách rút ra một số đặc điểm cơ bản từ mỗi khuôn mặt. Khi đó chúng ta có thể thu được những đặc điểm đó từ một người chưa biết và so sánh chúng với những đặc điểm của những người đã biết. Ví dụ: bạn có thể đo từng tai, xác định khoảng cách giữa hai mắt, độ dài của mũi, v.v. Nếu bạn đã từng xem một bộ phim truyền hình dài tập về công việc của các nhân viên phòng thí nghiệm tội phạm ở Las Vegas (CSI: Điều tra hiện trường vụ án), thì bạn sẽ biết chúng ta đang nói về điều gì:

Giống như trong phim! Nó trông rất đúng!

Phương pháp đáng tin cậy nhất để đo khuôn mặt của bạn

Được rồi, nhưng mỗi người cần có những đặc điểm gì để xây dựng cơ sở dữ liệu về những gương mặt nổi tiếng? Kích thước tai? Chiều dài mũi? Màu mắt? Còn gì nữa không?

Hóa ra những đặc điểm có vẻ hiển nhiên đối với con người chúng ta (như màu mắt) lại không có ý nghĩa đối với máy tính phân tích từng pixel trong một hình ảnh. Các nhà nghiên cứu nhận thấy cách tiếp cận phù hợp nhất là để máy tính tự xác định các đặc điểm cần thu thập. Học sâu có thể xác định các phần quan trọng của khuôn mặt để nhận dạng khuôn mặt tốt hơn con người.

Giải pháp là huấn luyện một mạng lưới thần kinh tích chập sâu (đó là những gì chúng tôi đã làm trong vấn đề 3). Nhưng thay vì huấn luyện mạng để nhận dạng các đối tượng đồ họa như chúng tôi đã làm lần trước, giờ đây chúng tôi sẽ huấn luyện nó để tạo ra 128 đặc điểm cho mỗi khuôn mặt.

Quá trình học diễn ra khi xem cùng lúc 3 hình ảnh khuôn mặt:

1. Tải lên hình ảnh đào tạo khuôn mặt của người nổi tiếng

2. Tải lên hình ảnh khuôn mặt khác của cùng một người

3. Tải ảnh khuôn mặt của người khác lên

Sau đó, thuật toán sẽ xem xét các đặc điểm mà nó hiện đang tạo ra cho từng hình ảnh trong số ba hình ảnh đó. Nó điều chỉnh một chút mạng lưới thần kinh để các đặc điểm mà nó tạo ra cho hình ảnh 1 và 2 gần nhau hơn một chút và các đặc điểm mà nó tạo ra cho hình ảnh 2 và 3 cách xa nhau hơn một chút.

Một bước học tập “có cấu trúc” duy nhất:

Sau khi lặp lại bước này hàng triệu lần cho hàng triệu hình ảnh của hàng nghìn người khác nhau, mạng lưới thần kinh có thể tạo ra 128 đặc điểm cho mỗi người một cách đáng tin cậy. Mười hình ảnh khác nhau của cùng một người sẽ cho những đặc điểm gần giống nhau.

Các chuyên gia về máy học nêu tên 128 đặc điểm trên mỗi khuôn mặt tập hợp các đặc điểm (tính năng). Ý tưởng giảm dữ liệu thô phức tạp, chẳng hạn như hình ảnh, thành danh sách các số do máy tính tạo ra đã được chứng minh là cực kỳ hứa hẹn đối với các máy đào tạo (đặc biệt là đối với dịch thuật). Phương pháp tiếp cận khuôn mặt mà chúng tôi đang sử dụng đã được các nhà nghiên cứu của Google đề xuất vào năm 2015, nhưng hiện có rất nhiều phương pháp tương tự.

Mã hóa hình ảnh khuôn mặt của chúng tôi

Quá trình huấn luyện mạng nơ ron tích chập để tạo ra các tập hợp đặc điểm khuôn mặt đòi hỏi một lượng lớn dữ liệu và hiệu suất máy tính cao. Ngay cả trên card màn hình NVidia Telsa đắt tiền cũng cần phải có khoảng 24 giờđào tạo liên tục để có được độ chính xác tốt.

Nhưng nếu mạng được huấn luyện thì có thể tạo ra các đặc điểm cho bất kỳ khuôn mặt nào, ngay cả những khuôn mặt chưa từng thấy trước đây! Như vậy, bước này chỉ cần thực hiện một lần. Thật may mắn cho chúng tôi, những người tốt ở OpenFace đã thực hiện việc này và đã cung cấp quyền truy cập vào một số mạng được đào tạo mà chúng tôi có thể sử dụng ngay lập tức. Cảm ơn Brandon Amos và nhóm!

Do đó, tất cả những gì chúng tôi phải làm là chạy hình ảnh khuôn mặt của mình thông qua mạng được đào tạo trước của họ và nhận 128 đặc điểm cho mỗi khuôn mặt. Dưới đây là thông số kỹ thuật cho hình ảnh thử nghiệm của chúng tôi:

Nhưng 128 con số này mô tả những phần cụ thể nào trên khuôn mặt? Hóa ra chúng ta không biết gì về điều này. Tuy nhiên, điều này không thực sự quan trọng với chúng tôi. Tất cả những gì chúng ta nên quan tâm là mạng tạo ra những con số gần giống nhau khi phân tích hai hình ảnh khác nhau của cùng một người.

Nếu bạn muốn tự mình thử bước này thì OpenFace sẽ cung cấp tập lệnh Lua để tạo tập hợp các đặc điểm của tất cả hình ảnh trong thư mục và ghi chúng vào tệp csv. Bạn có thể chạy nó như được hiển thị.

Bước 4. Tìm tên người sau khi mã hóa khuôn mặt

Bước cuối cùng thực sự là bước dễ nhất trong toàn bộ quá trình này. Tất cả những gì chúng ta phải làm là tìm ra người trong cơ sở dữ liệu gồm những gương mặt nổi tiếng có những đặc điểm gần nhất với những đặc điểm trong hình ảnh thử nghiệm của chúng ta.

Điều này có thể được thực hiện bằng cách sử dụng bất kỳ thuật toán phân loại học máy cơ bản nào. Không yêu cầu kỹ thuật học sâu đặc biệt. Chúng ta sẽ sử dụng một bộ phân loại SVM tuyến tính đơn giản nhưng có thể sử dụng nhiều thuật toán phân loại khác.

Tất cả những gì chúng ta cần làm là đào tạo một bộ phân loại có thể lấy các đặc điểm của hình ảnh thử nghiệm mới và báo cáo gương mặt nổi tiếng nào phù hợp nhất. Công việc của một bộ phân loại như vậy mất một phần nghìn giây. Kết quả công việc của người phân loại là tên của người đó!

Hãy thử hệ thống của chúng tôi. Đầu tiên, tôi huấn luyện bộ phân loại bằng cách sử dụng các bộ đặc điểm từ khoảng 20 hình ảnh của Will Ferrell, Chad Smith và Jimmy Fallon:

Ồ, những hình ảnh giảng dạy tuyệt vời này!

Sau đó tôi chạy trình phân loại trên từng khung hình của video Youtube nổi tiếng của Jimmy Fallon Will Ferrell và Chad Smith giả vờ là nhau :

Nó đã làm việc! Và hãy xem nó hoạt động tuyệt vời như thế nào đối với các khuôn mặt từ nhiều hướng khác nhau - ngay cả khi nhìn nghiêng!

Tự mình thực hiện toàn bộ quá trình

Hãy xem xét các bước cần thiết:

1. Xử lý hình ảnh bằng thuật toán HOG để tạo phiên bản đơn giản hóa của hình ảnh. Trong hình ảnh đơn giản này, hãy tìm khu vực gần giống nhất với hình đại diện HOG được tạo ra của khuôn mặt.

2. Xác định vị trí của khuôn mặt bằng cách thiết lập các điểm nhân trắc học chính trên đó. Khi các điểm nhân trắc học này đã được định vị, hãy sử dụng chúng để chuyển đổi hình ảnh vào giữa mắt và miệng.

3. Truyền hình ảnh chính giữa khuôn mặt qua mạng lưới thần kinh được huấn luyện để phát hiện các đặc điểm khuôn mặt. Lưu 128 đặc điểm kết quả.

4. Sau khi xem qua tất cả các khuôn mặt có đặc điểm được lấy trước đó, hãy xác định người có đặc điểm khuôn mặt gần nhất với đặc điểm thu được. Thế là xong!

Bây giờ bạn đã biết cách hoạt động của tất cả, hãy xem hướng dẫn từ đầu đến cuối về cách thực hiện toàn bộ quy trình nhận dạng khuôn mặt trên máy tính của riêng bạn bằng OpenFace:

Trước khi bạn bắt đầu

Đảm bảo bạn đã cài đặt Python, OpenFace và dlib. Bạn có thể cài đặt chúng theo cách thủ công hoặc sử dụng hình ảnh vùng chứa được định cấu hình sẵn đã được cài đặt sẵn:

Docker pull bamos/openface docker run -p 9000:9000 -p 8000:8000 -t -i bamos/openface /bin/bash cd /root/openface

Mẹo chuyên nghiệp dành cho người mới: Nếu bạn đang sử dụng Docker trên OSX, bạn có thể hiển thị thư mục OSX/Users/ bên trong hình ảnh vùng chứa, như hiển thị bên dưới:

Docker run -v /Users:/host/Users -p 9000:9000 -p 8000:8000 -t -i bamos/openface /bin/bash cd /root/openface

Sau đó, bạn có thể truy cập tất cả các tệp OSX của mình bên trong hình ảnh vùng chứa tại /host/Users/…

Ls /máy chủ/Người dùng/

Bước 1

Tạo một thư mục có tên ./training-images/ trong thư mục openface.

Hình ảnh đào tạo Mkdir

Bước 2

Tạo thư mục con cho mỗi người bạn muốn nhận dạng. Ví dụ:

Mkdir ./training-images/will-ferrell/ mkdir ./training-images/chad-smith/ mkdir ./training-images/jimmy-fallon/

Bước 3

Sao chép tất cả hình ảnh của mỗi người vào các thư mục con thích hợp. Hãy chắc chắn rằng chỉ có một khuôn mặt trong mỗi hình ảnh. Không cần thiết phải cắt xung quanh khuôn mặt. OpenFace sẽ tự động thực hiện việc này.

Bước 4

Thực thi các tập lệnh openface từ thư mục gốc openface:

Việc phát hiện và căn chỉnh vị trí phải được thực hiện trước tiên:

./util/align-dlib.py ./training-images/align externalEyesAndNose ./aligned-images/ --size 96

Thao tác này sẽ tạo một thư mục con mới./aligned-image/ với phiên bản đã được cắt và căn chỉnh của từng hình ảnh thử nghiệm của bạn.

Sau đó tạo chế độ xem từ các hình ảnh được căn chỉnh:

./batch-ređại diện/main.lua -outDir ./generated-embeddings/ -data ./aligned-images/

Thư mục con ./generated-embeddings/ sẽ chứa tệp csv với các bộ tính năng cho mỗi hình ảnh.

Huấn luyện mô hình nhận diện khuôn mặt của bạn:

./demos/classifier.py train ./generated-embeddings/

Một tệp mới có tên ./generated-embeddings/classifier.pk sẽ được tạo. Tệp này chứa mô hình SVM sẽ được sử dụng để nhận dạng khuôn mặt mới.

Từ giờ trở đi, bạn đã có một công cụ nhận dạng khuôn mặt hoạt động!

Bước 5. Nhận diện khuôn mặt!

Chụp một bức ảnh mới với một khuôn mặt không xác định. Chạy nó thông qua tập lệnh phân loại như sau:

./demos/classifier.py suy ra ./generated-embeddings/classifier.pkl your_test_image.jpg

Bạn sẽ nhận được một cảnh báo như thế này:

=== /test-image/will-ferrel-1.jpg === Dự đoán will-ferrel với độ tin cậy 0,73.

Tại đây, nếu muốn, bạn có thể định cấu hình tập lệnh python./demos/classifier.py.

Lưu ý quan trọng:

Nếu kết quả chưa đạt yêu cầu thì hãy thử thêm vài hình ảnh cho mỗi người ở bước 3 (đặc biệt là hình ảnh từ các hướng khác nhau).

Kịch bản này sẽ luôn đưa ra cảnh báo ngay cả khi nó không biết người đó. Trong sử dụng thực tế, bạn nên kiểm tra mức độ tin cậy và xóa các cảnh báo có giá trị độ tin cậy thấp vì rất có thể chúng không chính xác.

Thêm thẻ

Lễ kỷ niệm iPhone X nhận được một trong những tính năng đặc biệt nhất trong số các đối thủ cạnh tranh. Flagship có thể nhận dạng khuôn mặt của chủ sở hữu và thay vì Touch ID và nút Home, các kỹ sư đã tích hợp camera TrueDepth và chức năng Face ID.

Nhanh chóng, tức thì và không cần nhập mật khẩu. Đây là cách bạn có thể mở khóa iPhone X ngay hôm nay.

Apple nổi tiếng là người luôn hướng tới tương lai công nghệ từ rất lâu trước khi tính năng tiếp theo trở thành tiêu chuẩn. Trong trường hợp của iPhone X và máy quét khuôn mặt, công ty tự tin rằng nhận dạng khuôn mặt là tương lai.

Hãy cùng tìm hiểu xem Apple nhầm hay khuôn mặt của chúng ta - đây là một bước tiến chắc chắn đến tương lai kỹ thuật số.

😎 Chuyên mục Công nghệ được đăng tải hàng tuần với sự hỗ trợ của re:Store.

Vậy nhận dạng khuôn mặt hoạt động như thế nào?

Công nghệ nhận dạng khuôn mặt đòi hỏi một số thành phần để hoạt động. Đầu tiên, chính máy chủ, nơi lưu trữ cả cơ sở dữ liệu và thuật toán so sánh đã chuẩn bị sẵn.

Thứ hai, một mạng lưới thần kinh được suy nghĩ kỹ lưỡng và được đào tạo bài bản, được cung cấp hàng triệu bức ảnh có dấu. Những mạng như vậy rất dễ huấn luyện. Họ tải ảnh lên và hiển thị lên hệ thống: “Đây là Viktor Ivanov,” rồi đến ảnh tiếp theo.

Mạng lưới thần kinh phân phối độc lập các vectơ đặc trưng và tìm ra các mô hình hình học của khuôn mặt theo cách mà sau đó nó có thể nhận ra Victor một cách độc lập từ hàng nghìn bức ảnh khác.

Công nghệ FaceN tương tự mà chúng ta sẽ nói đến bên dưới, sử dụng khoảng 80 đặc điểm số khác nhau.

Tại sao mọi người đột nhiên nói về nhận dạng khuôn mặt?

Vào giữa năm 2016, Internet bùng nổ theo đúng nghĩa đen với ứng dụng cùng tên. Bằng cách sử dụng mạng lưới thần kinh, các nhà phát triển đã biến những giấc mơ điên rồ nhất của người dùng mạng xã hội thành hiện thực.

Khi bạn nhìn thấy một người trên phố, bạn có thể chụp ảnh người đó trên điện thoại thông minh của mình, gửi ảnh tới FindFace và sau vài giây sẽ tìm thấy trang của anh ấy trên VKontakte. Thuật toán được cải tiến, cập nhật và nhận diện khuôn mặt ngày càng tốt hơn.

Tất cả bắt đầu bằng việc nhận dạng giống chó từ các bức ảnh. Tác giả của công nghệ nhận dạng FaceN và ứng dụng Magic Dog là Artem Kukharenko. Anh chàng nhanh chóng nhận ra rằng công nghệ này chính là tương lai và bắt đầu phát triển.

Sau thành công của ứng dụng FindFace, người sáng lập công ty phát triển N-Tech.Lab Kukharenko một lần nữa bị thuyết phục rằng nhận dạng khuôn mặt rất thú vị ở hầu hết mọi ngành:

dịch vụ biên giới

sòng bạc

sân bay

bất kỳ nơi đông người nào

thị trường

công viên giải trí

Dịch vụ thông minh

Vào tháng 5 năm 2016, N-Tech.Lab bắt đầu thử nghiệm dịch vụ này cùng với chính quyền Moscow. Hàng chục nghìn camera được đặt khắp thủ đô để xác định người qua đường theo thời gian thực.

Câu chuyện có thật. Bạn chỉ cần đi bộ qua sân nơi lắp đặt một chiếc camera như vậy. Cơ sở dữ liệu về tội phạm và người mất tích được kết nối với nó. Nếu thuật toán xác định bạn giống nghi phạm, cảnh sát sẽ ngay lập tức nhận được cảnh báo.

Tất nhiên, bạn có thể tìm thấy ngay một người trên mạng xã hội và tìm kiếm thông qua bất kỳ cơ sở dữ liệu nào. Bây giờ hãy tưởng tượng rằng những camera như vậy được lắp đặt dọc theo chu vi của toàn thành phố. Kẻ tấn công sẽ không thể trốn thoát. Có camera ở khắp mọi nơi: trong sân, lối vào, trên đường cao tốc.

Mọi thứ đang diễn ra như thế nào với nhận dạng khuôn mặt ở Nga?

Bạn sẽ ngạc nhiên, nhưng kể từ giữa năm 2016, các thị trưởng Moscow đã tích cực triển khai hệ thống nhận dạng khuôn mặt trên toàn thành phố.

Đến nay, hơn 100 nghìn camera có khả năng nhận diện khuôn mặt đã được lắp đặt chỉ riêng tại lối vào các tòa nhà cao tầng ở Moscow. Hơn 25 nghìn được lắp đặt trong bãi. Tất nhiên, những con số chính xác đã được phân loại, nhưng hãy yên tâm, việc kiểm soát tích cực đang lan truyền nhanh hơn bạn tưởng.

Tại thủ đô, hệ thống nhận dạng khuôn mặt được lắp đặt ở khắp mọi nơi: từ quảng trường, nơi đông người cho đến phương tiện giao thông công cộng. Kể từ khi hệ thống được lắp đặt, hơn mười tội phạm đã bị giam giữ, nhưng đây chỉ là số liệu chính thức.

Toàn bộ camera liên tục trao đổi thông tin với Trung tâm tính toán hợp nhất của Cục Công nghệ thông tin. Cảnh báo đáng ngờ ngay lập tức được các cơ quan thực thi pháp luật kiểm tra.

Và điều này chỉ là khởi đầu. Vào cuối năm ngoái, một hệ thống điều khiển tương tự đã bắt đầu được thử nghiệm trên đường phố St. Petersburg. Sự tiện lợi của công nghệ do FindN đề xuất là không cần thiết phải lắp đặt bất kỳ camera đặc biệt nào.

Hình ảnh từ camera CCTV tiêu chuẩn được xử lý bằng thuật toán “thông minh” và điều kỳ diệu thực sự sẽ xảy ra ở đó. Theo dữ liệu hiện tại, độ chính xác nhận dạng của FindFace ngày nay dao động trong khoảng 73% - 75%. Các nhà phát triển tự tin rằng họ sẽ có thể đạt được kết quả 100% trong tương lai gần.

Nhận dạng khuôn mặt ra đời như thế nào?

Ban đầu, bất kỳ loại nhận dạng sinh trắc học nào đều được sử dụng riêng trong các cơ quan và dịch vụ thực thi pháp luật nơi an ninh là ưu tiên hàng đầu. Chỉ trong vài năm, việc đo các đặc điểm giải phẫu và sinh lý để nhận dạng cá nhân đã trở thành tiêu chuẩn trong hầu hết các thiết bị tiêu dùng.

Có nhiều loại xác thực sinh trắc học:

bằng ADN

dọc theo mống mắt của mắt

lòng bàn tay

bằng giọng nói

bằng dấu vân tay

ở mặt

Và công nghệ thứ hai đặc biệt thú vị vì nó có một số ưu điểm so với các công nghệ khác.

Nguyên mẫu của công nghệ nhận dạng khuôn mặt vào thế kỷ 19 đầu tiên là “chân dung theo mô tả” và sau đó là những bức ảnh. Bằng cách này, cảnh sát có thể xác định được tội phạm. Năm 1965, hệ thống nhận diện khuôn mặt bán tự động được phát triển dành riêng cho chính phủ Mỹ. Năm 1971, công nghệ này được quay trở lại, xác định các dấu hiệu cơ bản cần thiết để nhận dạng khuôn mặt, nhưng không lâu dài.

Kể từ đó, các cơ quan tình báo vẫn ưu tiên sử dụng công nghệ lấy dấu vân tay đã được chứng minh là công nghệ nhận dạng sinh trắc học chính của họ.

Và tất cả là do công nghệ không cho phép bất kỳ sự tương tác nào với các đặc điểm trên khuôn mặt của con người. Vào thời điểm đó, tia laser siêu chính xác, cảm biến hồng ngoại và bộ xử lý mạnh mẽ cũng như bản thân hệ thống nhận dạng chưa tồn tại.

Với sự ra đời của máy tính mạnh mẽ, hầu hết tất cả các bộ phận đều quay trở lại nhận dạng thông qua quét khuôn mặt. Công nghệ này bùng nổ ở các phòng ban và cơ quan đặc biệt vào giữa những năm 2000, và năm ngoái công nghệ này bắt đầu được sử dụng lần đầu tiên trong các thiết bị tiêu dùng.

Công nghệ nhận dạng khuôn mặt được sử dụng ngày nay ở đâu?

Trong điện thoại thông minh

Việc phổ biến công nghệ nhận dạng khuôn mặt bắt đầu từ chiếc smartphone đầu bảng của Apple. iPhone X tạo ra xu hướng trong những năm tới và các OEM đã tích cực bắt đầu tích hợp tính năng tương tự Face ID vào thiết bị của họ.

Trong ngân hàng

Nhận dạng khuôn mặt sinh trắc học đã được sử dụng ở Hoa Kỳ trong vài năm. Bây giờ công nghệ đã đến Nga. Chỉ riêng trong năm 2017, nhờ triển khai hệ thống này, đã có thể ngăn chặn hơn 10 nghìn giao dịch gian lận và tiết kiệm được số tiền 1,5 tỷ rúp.

Nhận dạng khuôn mặt được sử dụng để nhận dạng khách hàng và đưa ra quyết định về khả năng cấp khoản vay.

Trong các cửa hàng

Phân khúc bán lẻ sử dụng công nghệ theo cách riêng của mình. Vì vậy, nếu bạn mua một số thiết bị gia dụng trong cửa hàng và sau một thời gian quay lại để mua hàng khác, hệ thống nhận dạng khuôn mặt sẽ ngay lập tức nhận dạng bạn ở lối vào. Người bán sẽ ngay lập tức nhận được thông tin từ cơ sở dữ liệu và không chỉ tìm ra tên mà còn cả lịch sử mua hàng của bạn. Hành vi tiếp theo của người bán rất dễ dự đoán.

Trong cuộc sống đô thị

Đây chính xác là những gì công nghệ được phát triển và phát triển. Từ sân vận động đến rạp chiếu phim, bất cứ nơi nào có lượng người đông đúc, việc nhận dạng là đặc biệt quan trọng. Ngày nay, công nghệ nhận dạng khuôn mặt giúp ngăn chặn bạo loạn và tấn công khủng bố.

Những công ty nào quan tâm đến nhận dạng khuôn mặt?

Google, Facebook, Apple và những gã khổng lồ CNTT khác hiện đang tích cực mua các dự án từ các nhà phát triển liên quan đến nhận dạng khuôn mặt. Họ đều nhìn thấy tiềm năng to lớn trong công nghệ.

Đây chỉ là một phần của các giao dịch được công bố chính thức. Trong thực tế, có rất nhiều trong số họ. Ngoài việc tích hợp Face ID và các công nghệ tương tự vào điện thoại thông minh, các công ty CNTT hàng đầu còn có kế hoạch lớn hơn nhiều trong việc sử dụng nhận dạng khuôn mặt.

Tương lai với nhận dạng khuôn mặt sẽ như thế nào

Chúng ta đã tìm ra những lợi ích mà công nghệ quét khuôn mặt mang lại cho điện thoại thông minh và thiết bị điện tử, vì vậy hãy nhìn về tương lai gần và tưởng tượng một ngày nào đó trong đời một người thấy mình ở một thành phố nơi camera nhận dạng khuôn mặt được lắp đặt ở khắp mọi nơi.

Chào buổi sáng! Hãy mỉm cười, hệ thống nhà thông minh đang nhìn bạn. Ừm, thưa chủ nhân, hôm qua tôi đã uống nhiều - tôi nhìn thấy rõ trên mặt, tôi khó nhận ra. Vì vậy, bên cạnh vợ tôi, Barsik đang ăn xong bữa tối ở hành lang. Không có người lạ. Tuyệt vời.

Nhìn thoáng qua máy pha cà phê ở khoảng cách “gần hơn bình thường một chút” và Americano nồng độ trung bình với sữa hơi ấm đã sẵn sàng. Rất tiếc, có ai đó đang ở ngoài cửa! Ôi, đây chính là mẹ chồng yêu thích của tôi. Hãy vào, cánh cửa đang mở cho bạn - không một hệ thống nhận dạng nào trên thế giới có thể quên khuôn mặt của bạn.

Bạn chuẩn bị sẵn sàng và tiếp cận thang máy. Không, không, hệ thống nhận dạng này đã biết bạn thích ngồi ở thang máy bên ngoài hơn nên đã gọi rồi.

Nhìn thấy bạn từ xa, chiếc xe điện 500 mã lực tự động điều chỉnh tầm tay lái và điều chỉnh vị trí ghế. Cửa mở - ngồi đi.

Trong khi các nhà sản xuất hệ thống lái tự động đang cố gắng thuyết phục pháp luật về sự cần thiết của phương tiện không người lái không thành công, hãy cố gắng không vi phạm luật lệ giao thông. Camera giám sát ở khắp mọi nơi, việc nộp phạt là điều khó tránh khỏi. Suy cho cùng, bạn là người lái xe, và ngay khi bạn nhấn bàn đạp ga xuống sàn, khoản tiền phạt chạy quá tốc độ sẽ được ghi vào thẻ ngân hàng của bạn.

Cuối cùng, chúng tôi đang ở tòa nhà văn phòng của chính công ty đang đưa công nghệ nhận dạng khuôn mặt vào cơ sở hạ tầng của các thành phố ở Nga. Vâng, đó là công việc của bạn. Kiểm soát chặt chẽ, nhưng bạn không phải lo lắng - khi bạn đỗ xe, các camera đã nhận ra bạn.

Công việc trở nên khó khăn hơn: dọc theo toàn bộ chu vi của văn phòng có các camera nhận dạng để “nhìn thấy” ai đang làm gì, đồng thời có thể đọc được cảm xúc. Nói tóm lại, việc đùa giỡn ở nơi làm việc sẽ không hiệu quả.