Một chương trình điều khiển máy tính bằng giọng nói của bạn. Cách đơn giản nhất để điều khiển máy tính bằng giọng nói của bạn. Điều khiển bằng giọng nói không hoạt động. Nguyên nhân có thể là gì và cách khắc phục

Hôm nay chúng ta sẽ nói về bài phát biểu của chúng tôi. Tôi ước bạn điều khiển máy tính bằng giọng nói của bạn, mà không cần sử dụng ngón tay của bạn? Và, như người ta nói, với sức mạnh của tư duy! Đúng là chúng ta sẽ không điều khiển máy tính bằng sức mạnh của suy nghĩ, nhưng với sức mạnh của giọng nói thì điều đó hoàn toàn có thể xảy ra.

chương trình kiểu là một trong những chương trình tốt nhất hiện nay để điều khiển máy tính qua giọng nói. Trên các trang web trong phần bình luận cho chương trình này, các ý kiến ​​đều hội tụ.

Đúng, nó có nhược điểm của nó. Nhưng nhiều hơn về điều này sau. Nhân tiện, nếu bạn quan tâm, hãy đọc bài đánh giá của tôi.

Bạn có thể tải xuống chương trình tại đây: http://freesoft.ru/type

Làm thế nào để sử dụng nó? Đầu tiên, hãy khởi chạy nó và xem các nút điều khiển chính:

Chương trình chào đón chúng tôi và ngay lập tức cung cấp cho chúng tôi các mẹo về cách sử dụng Typle. Đầu tiên, nhấp vào nút “thêm” và viết ra một từ, ví dụ như “mở”. Để làm điều này, hãy nói từ này vào micrô:

Sau đó bấm vào thêm. Vì vậy, chúng tôi đã lưu từ “Mở” trong chương trình bằng giọng nói của mình. Bạn có thể nói bất kỳ từ nào khác vào micro. Điều chính là không để bị nhầm lẫn.

Bước tiếp theo là thêm lệnh. Để làm điều này, chúng ta hãy đi đến điểm này:

Sau đó, chúng tôi đánh dấu vào ô bên cạnh mục chúng tôi cần:

Chọn một chương trình, ứng dụng hoặc hành động và nhấp vào nút ghi màu đỏ. Nếu máy tính đã chấp nhận giọng nói của chúng tôi, hãy nhấp vào “Thêm”:

Và bây giờ một lệnh thoại sẽ hiển thị trong hồ sơ của chúng tôi. TRONG trong trường hợp này cái mở 7-Zip:

Và bây giờ, bằng cách nhấp vào nút “bắt đầu nói chuyện” cuối cùng

Chúng tôi nói cụm từ “mở Seven Zip.” Trong trường hợp của tôi, mọi thứ sẽ hoạt động. Và chương trình 7-zip sẽ mở ra. Hãy nhớ câu này: Chỉ cần mở lòng mình? Đây là một cái gì đó gần giống nhau.

Chương trình không phải lúc nào cũng hoạt động hiệu quả. Giờ đây ngôn ngữ Nga hùng mạnh vẫn chưa được các nhà lập trình ngôn ngữ học nghiên cứu đầy đủ... Nhưng thật tuyệt khi máy tính lắng nghe bạn.

Vì vậy, để thử nghiệm và tò mò tầm thường, chương trình Typle phù hợp 100%.

Trong video này, bạn có thể xem lịch sử tạo ra công cụ giọng nói đầu tiên và những gì chúng tôi cần phải làm:

Có những cái tên khủng khiếp như vậy của các chương trình tương tự khác của chương trình như Gorynych, Perpetuum, Dictograph, Voice Commander. Nhưng tất cả đều “sai”. Họ không vượt qua những lời chỉ trích về một chương trình xứng đáng.

Tôi mất 5 phút để thành thạo chương trình này. Đây là một khoảng thời gian khá dài (thường thì tôi hiểu những chương trình như vậy trong 1-2 phút). Nếu bạn có bất kỳ câu hỏi nào, hãy viết. Trước hẹn sớm gặp lại, Bạn:)!

Bạn có thể tương tác với máy tính của mình không chỉ bằng bàn phím và chuột. Điều khiển lệnh bằng giọng nói cũng có sẵn. Hiện hữu tiện ích đặc biệt cho phép bạn làm điều này. Chức năng của chúng không chỉ bao gồm ghi văn bản dưới dạng đọc chính tả hoặc chép lại bản ghi âm. Thông qua chúng, bạn có thể khởi chạy ứng dụng, sử dụng chúng và nói chung là làm bất cứ điều gì. Điều khiển bằng giọng nói của máy tính giúp bạn làm việc với PC dễ dàng hơn. Các lệnh được truyền đi nhanh chóng và không nỗ lực nhiều. Tất nhiên, nếu bạn có micro.

Chúng tôi sẽ giới thiệu cho bạn những ứng dụng có chức năng tương tự

Chức năng này được tích hợp sẵn trong phiên bản tiếng Anh của Windows. Để sử dụng nó, bạn phải có giấy phép Enterprise hoặc Ultimate. Nhưng ngay cả trong hệ điều hành được Nga hóa, bạn có thể định cấu hình điều khiển bằng giọng nói và đọc chính tả văn bản. Sử dụng một trong các ứng dụng sau.

Ứng dụng này rất dễ hiểu

Chương trình phổ biến. Mặc dù nó có nhược điểm của nó. Bản chất công việc của nó rất đơn giản: bạn đặt lệnh và chọn hành động cần thực hiện. Hãy xem việc thiết lập ứng dụng này bằng một ví dụ cụ thể.

  1. Tải về và cài đặt nó. Có phiên bản miễn phí và Premiun. Bạn phải mua cái thứ hai để dùng thử trên máy tính của mình.
  2. Khởi chạy tiện ích. Một cửa sổ thông tin với các mẹo sẽ xuất hiện.
  3. Có rất nhiều thứ trên bảng điều khiển của cô ấy. các chức năng khác nhau. Một số - với cùng tên. Bạn cần điều hướng bằng hình ảnh chứ không phải bằng dòng chữ. Nhấp vào nút "Thêm" - nó hiển thị một khuôn mặt.
  4. Đặt tên hồ sơ của bạn và từ khóa, sẽ đại diện cho lệnh. Ví dụ: viết “mở” nếu bạn định định cấu hình khởi chạy ứng dụng bằng giọng nói. Hoặc “go to” để truy cập ngay vào một trang web mà không cần nhập địa chỉ của nó.
  5. Bây giờ chúng ta cần ghi lại lệnh này dưới dạng hình ảnh âm thanh. Bấm vào nút có vòng tròn màu đỏ. Và phát âm rõ ràng, rõ ràng cụm từ mong muốn vào micro.
  6. Xác nhận những thay đổi. Tùy chọn đã chỉ định sẽ xuất hiện trong danh sách trong cửa sổ Loại. Chương trình sẽ ghi nhớ những gì bạn đã ghi trên “máy ghi âm” của nó.
  7. Sau đó, chỉ định những gì trên thực tế sẽ chạy để thực thi lệnh. Nhấp vào nút "Thêm", trông giống như một bàn tay có biểu tượng "+" (dấu cộng).
  8. Chọn định dạng dữ liệu: tập tin/tiện ích, trang Internet, một số dịch vụ nội bộ hệ điều hành. Đánh dấu vào các ô nơi bạn cần chúng.
  9. Tìm ứng dụng bạn muốn khởi chạy bằng giọng nói của mình. Hãy để nó như vậy, ví dụ, Phần mềm soạn thảo văn bản. Bằng cách này, bạn có thể nhanh chóng bắt đầu chỉnh sửa một số văn bản hoặc viết một bài báo.
  10. Trong cùng một cửa sổ, viết phần thứ hai của lệnh. Vì vậy, tổng cộng nó hóa ra là "Word mở". Từ đầu tiên sẽ kích hoạt Typle, từ thứ hai sẽ kích hoạt tiện ích liên quan.
  11. Nhấp vào Thêm.
  12. Một số ứng dụng có thể được gắn vào một chức năng “mở”. Bằng cách này, bạn sẽ điều khiển việc khởi chạy chúng mà không cần chạm vào chuột và các thao tác khác. thiết bị ngoại viđược cài đặt trên máy tính.
  13. Nếu cần thiết, chỉnh sửa các tham số bổ sung.
  14. Để kiểm tra xem nó có hoạt động hay không, hãy nhấp vào “Bắt đầu nói” và nói lệnh.

Chương trình hoạt động với tiếng Nga. Nhưng không phải lúc nào nó cũng nhận ra nó một cách chính xác. Bạn phải nói to, rõ ràng, bằng giọng máy móc.

  • Không cần biết tiếng Anh.
  • Tạo nhóm nhanh chóng.
  • Không nhận dạng văn bản.
  • Chức năng hạn chế. Bạn chỉ có thể mở các tiện ích và trang trên Internet.
  • Chương trình đôi khi nhận thấy tiếng ồn bên ngoài với tư cách là các đội. Vì điều này, những điều kỳ lạ xảy ra trên PC.
  • Bạn không thể làm việc với người chơi.

bài phát biểu

Một ứng dụng khác để quản lý máy tính của bạn

  1. Khi bạn khởi chạy nó lần đầu tiên, một cửa sổ sẽ mở ra yêu cầu bạn chọn danh mục: PC hoặc Internet.
  2. Ngoài ra còn có phần giải thích về tổ hợp phím nào bạn cần để kích hoạt tiện ích. Điều này có thể được thay đổi trong cài đặt.
  3. Ví dụ: nhấp vào “Internet”. Một cửa sổ sẽ mở ra với một số trường nhập: dành cho văn bản lệnh và URL của trang web. Bạn có thể viết từ “Yandex” và địa chỉ của trang này.
  4. Nhấp vào "Thêm".
  5. Bấm và giữ các phím được chỉ định trên cửa sổ chính.
  6. Nói lệnh để tiện ích “ghi nhớ” nó.

  • Kích hoạt bằng cả phím và âm lượng.
  • Khi khởi động, bạn có thể hiệu chỉnh micrô.
  • Chức năng hạn chế.

Loa

Giao diện được thiết kế theo phong cách tối giản

Các lệnh trong ứng dụng được đặt bằng cách sử dụng từ in thay vì đọc chính tả. Có cơ chế nhận dạng văn bản nội bộ. Chức năng chính:

  • Chụp ảnh màn hình theo lệnh.
  • Thay đổi bố cục bàn phím trên máy tính của bạn.
  • Mở ứng dụng và tập tin.
  • Tắt.
  • Bạn không cần phải ghi âm với nhóm. Tiện ích này nhận dạng các chữ khắc.
  • Để điều khiển bạn cần sử dụng bàn phím. Nếu như nút đặt trướcđược sử dụng cho các mục đích khác - nó sẽ bất tiện.
  • Bạn cần có kết nối Internet ổn định.

Gorynych

Người anh hùng trong truyện dân gian Nga sẽ giúp bạn

Chương trình điều khiển máy tính bằng giọng nói “Gorynych” - sản phẩm nội địa. Do đó, có một mô-đun nhận dạng giọng nói “bản địa”. Nó “thích ứng” với âm sắc và ngữ điệu của người dùng. Với tiện ích này, bạn hoàn toàn có thể làm việc trong hệ thống chứ không chỉ mở các tệp và trang web.

  • Bạn cần tự tạo lệnh cho từng quy trình. Theo nghĩa đen, bạn sẽ phải viết ra từ điển.

Nhận dạng giọng nói của Windows

Chương trình được tích hợp trong hệ điều hành tiếng Anh. Để sử dụng nó, bạn phải có thiết bị thích hợp gói ngôn ngữ. Các đội Nga sẽ không làm việc với cô ấy. Để điều khiển PC với sự trợ giúp của nó, bạn sẽ phải nói được ngôn ngữ của nó. Để truy cập nó trong Bảng điều khiển cài đặt Windows Mở menu “Ngôn ngữ và Tiêu chuẩn khu vực” (Nó nằm trong danh mục “Đồng hồ, Ngôn ngữ, Khu vực”) và đặt “Tiếng Anh” trong tất cả các tab. Nếu mọi thứ đều chính xác và bạn đã cài đặt gói ngôn ngữ cần thiết, Windows sẽ “chuyển” sang tiếng Anh và tiện ích sẽ có sẵn. Tốt hơn là không nên thử phương pháp này nếu bạn không biết rõ ngoại ngữ.

Phương pháp này phù hợp nếu bạn nói tiếng Anh

Tiện ích khác

Có một số ứng dụng khác để quản lý các lệnh như vậy:

  • Tiện ích mở rộng của trình duyệt. Giúp lướt mạng dễ dàng hơn. Trên Google Chrome rồi Một chức năng tương tự được tích hợp sẵn - nhập giọng nói vào các biểu mẫu tìm kiếm. Một số bản đồ trực tuyến có tùy chọn này. Nó cho phép bạn tìm thấy một địa chỉ nhanh hơn.
  • Loại giọng nói.
  • RealSpeaker.
  • Bài phát biểu trên web.

Danh sách các chương trình nhận dạng văn bản và ghi chính tả

Tất nhiên, điều khiển bằng giọng nói là tốt. Nhưng hóa ra chúng có thể là tiện ích hữu íchđể nhận dạng văn bản và in chính tả. Khi biên soạn các báo cáo và bằng cấp dài, việc ghi lại suy nghĩ của bạn sẽ dễ dàng hơn bằng cách nói chúng vào micrô trên máy tính. Dưới đây là một vài tiện ích như vậy:

  • Máy ghi chép.
  • Rồng Nói Tự Nhiên.
  • Điện thoại di động vĩnh viễn.

Một sản phẩm cho phép bạn đọc chính tả văn bản trên máy tính

Bạn có thể cấu hình lệnh thoại trong hệ điều hành. Để làm điều này, chương trình thích hợp phải được cài đặt trên máy tính. Với nó, bạn có thể làm việc trên PC khi nằm trên ghế sofa hoặc nằm dài trên ghế. Bàn tay của bạn sẽ được tự do. Nếu micro tốt và thu âm thậm chí ở xa hoặc âm thanh yên tĩnh, bạn sẽ không cần phải ngồi cạnh anh ấy. Bạn có thể đồng thời “nói chuyện” với máy tính và viết ghi chú vào sổ, vẽ hoặc cầm thứ gì đó. Có, thậm chí cả may vá và đan lát. Việc tương tác với các lệnh trên PC dễ dàng hơn nhiều. Để kích hoạt một số tiện ích này, bạn cần nhấn các nút trên bàn phím, điều này không thuận tiện lắm.

Nhưng cũng có những mặt tiêu cực. Nếu bạn vô tình nói một từ lệnh, một ứng dụng hoàn toàn không cần thiết bây giờ sẽ mở ra hoặc trình duyệt sẽ truy cập một số trang web một cách không thích hợp. Sử dụng cái gì và có sử dụng nó hay không là tùy bạn quyết định.

Một trong những nhiệm vụ chính hệ điều hành Android là công cụ điều khiển thiết bị đơn giản và trực quan nhất có thể. Với mỗi bản cập nhật, ngày càng có nhiều tính năng mới xuất hiện giúp đơn giản hóa việc sử dụng một cách đáng kể. Một tính năng như vậy là điều khiển bằng giọng nói của Android.

Điều khiển bằng giọng nói Android

Điều khiển bằng giọng nói của Android là công nghệ tiên tiến, nhờ đó bạn có thể điều khiển thiết bị mà không cần những thao tác không cần thiết mà chỉ bằng giọng nói của mình. Tính năng này đang được phát triển phát triển tích cực và cải tiến.

Ok, Google trên Android giúp bạn có thể sử dụng thiết bị hiệu quả hơn. Bạn có thể thực hiện nhiều chức năng bằng giọng nói của mình và nhận được kết quả chất lượng cao. Ví dụ: tìm kiếm thông tin cần thiết, bật/tắt ứng dụng và thậm chí gõ văn bản. Đến nay sự phát triển này không lý tưởng và có nhiều thiếu sót.

Tất cả các lệnh có thể được thực hiện bằng cách sử dụng điều khiển giọng nóiđược chia thành hai nhóm.

Cụ thể là:

  1. kiểm soát các chức năng của chính thiết bị - nếu bạn muốn nghe nhạc, chỉ cần nói “Phát danh sách phát”, nếu bạn muốn bật báo thức, hãy nói cụm từ “Đánh thức tôi dậy vào thời điểm như vậy” và sớm
  2. tìm kiếm thông tin - yêu cầu bằng giọng nói bạn có thể tìm hiểu, chẳng hạn như thời tiết, xem tỷ số trận đấu của đội bạn yêu thích, tìm lời bài hát, v.v.

Nhưng thật không may, có một số hạn chế trong hoạt động điều khiển bằng giọng nói. Đôi khi bạn không thể lấy được thông tin cho các yêu cầu không được yêu cầu. Ví dụ: bạn quan tâm đến lịch chiếu ở các rạp chiếu phim ở Kiev và bạn sẽ nhận được câu trả lời mà không gặp vấn đề gì, nhưng nếu bạn hỏi cùng một yêu cầu, nhưng liên quan đến một thành phố nhỏ hơn, thì vấn đề có thể phát sinh và bạn có thể gặp phải tình trạng thiếu thông tin.

Cách bật điều khiển bằng giọng nói

Để sử dụng điều khiển bằng giọng nói Ok, Google, bạn phải kết nối vĩnh viễn tới Internet. Với kích thước hạn chế, ứng dụng có thể hoạt động mà không cần Internet, nhưng chất lượng nhận dạng giọng nói sẽ rất kém và việc sử dụng chức năng này gần như không thể.

  1. cài đặt ứng dụng Google, nếu bạn đã cài đặt ứng dụng này thì hãy đảm bảo rằng đó là phiên bản mới nhất
  2. truy cập ứng dụng Google
  3. ở góc trên bên trái nhấp vào biểu tượng trông giống ba đường ngang
  4. sau đó đi đến " Cài đặt»
  5. chọn " Tìm kiếm bằng giọng nói »
  6. sau đó - " Công nhận Được, Google" hoặc " Trên bất kỳ màn hình nào»

Trên một số thiết bị, tính năng nhận dạng giọng nói có sẵn trong các ứng dụng không phải ứng dụng Google. Để làm điều này trong chương trình Google nhấp chuột:

  1. « Cài đặt»
  2. Hơn nữa - " Các ứng dụng" Ở đó bạn sẽ thấy danh sách các chương trình mà bạn có thể sử dụng Ok, Google

Cách thiết lập điều khiển bằng giọng nói

Chức năng Ok, Google luôn hoạt động miễn là bạn có ứng dụng Google đang chạy hoặc Google Chrome. Sau khi kích hoạt, hệ thống sẽ ghi lại giọng nói của bạn và sẽ không có vấn đề gì với việc nhận dạng trong tương lai. Để đưa ra yêu cầu, chỉ cần nói cụm từ Ok, Google và đặt câu hỏi hoặc lệnh.

Cách tắt điều khiển bằng giọng nói

Vô hiệu hóa Ok, Google không khó hơn việc kích hoạt nó. Để làm điều này, bạn cần phải làm như sau:

  1. truy cập ứng dụng Google
  2. ở góc trên bên trái có biểu tượng hình ba đường ngang
  3. chọn " Tìm kiếm bằng giọng nói»
  4. Hơn nữa " Công nhận Được, Google»
  5. xóa hộp kiểm - " Trên bất kỳ màn hình nào" hoặc " Luôn luôn»

Khẩu lệnh

Ok, Google nhận ra nhiều lệnh khác nhau. Không có danh sách truy vấn cụ thể sẽ được thực hiện vì chúng khác nhau đối với mỗi người dùng.

Dưới đây là danh sách nhỏ các lệnh có thể được thực hiện bằng điều khiển bằng giọng nói:

  • gọi cho bất cứ ai từ danh sách liên lạc của bạn
  • gửi tin nhắn văn bản
  • gửi email
  • đăng lên mạng xã hội
  • để theo dõi gói hàng
  • chạy chương trình
  • tìm hiểu thời tiết
  • nhận chỉ đường đến đích của bạn
  • tìm một địa điểm, công ty, cơ sở
  • dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác
  • xác định một bài hát và vân vân

Điều khiển bằng giọng nói không hoạt động. Nguyên nhân có thể là gì và cách khắc phục?

Đảm bảo điều khiển bằng giọng nói đang hoạt động: " Cài đặt» - « Tìm kiếm bằng giọng nói» - « Công nhận Được rồi, Google" Kiểm tra hộp - " Từ Ứng dụng Google " Cũng cho vận hành chính xácĐiều khiển bằng giọng nói yêu cầu kết nối internet. Đảm bảo thiết bị của bạn được kết nối với Wi-Fi hoặc Internet di động. Hãy thử khởi động lại thiết bị của bạn.

Một người đến gặp tôi với yêu cầu viết một chương trình cho phép anh ta điều khiển chuột máy tính bằng giọng nói của mình. Sau đó, tôi thậm chí không thể tưởng tượng rằng một người gần như bị liệt hoàn toàn, thậm chí không thể quay đầu mà chỉ có thể nói chuyện, lại có khả năng phát triển hoạt động tích cực, giúp bản thân và những người khác sống một cuộc sống năng động, tiếp thu kiến ​​​​thức và kỹ năng mới, làm việc và kiếm tiền. money. , giao tiếp với những người khác trên khắp thế giới, tham gia một cuộc thi dự án xã hội.

Hãy để tôi cung cấp ở đây một vài liên kết đến các trang web, tác giả và/hoặc người truyền cảm hứng tư tưởng trong số đó là người này - Alexander Makarchuk đến từ thành phố Borisov, Belarus:

Để làm việc trên máy tính, Alexander đã sử dụng chương trình “Vocal Joystick” - do sinh viên Đại học Washington phát triển, do National tài trợ. Quỹ khoa học(NSF). Xem melodi.ee.washington.edu/vj

Tôi không thể cưỡng lại

Nhân tiện, trên trang web của trường đại học (http://www.washington.edu/) 90% bài viết là về tiền bạc. Thật khó để tìm thấy bất cứ điều gì về công việc khoa học. Ví dụ, đây là những đoạn trích từ trang đầu tiên: “Tom, một sinh viên tốt nghiệp đại học, từng ăn nấm và gặp khó khăn trong việc trả tiền thuê nhà. Bây giờ anh ấy là quản lý cấp cao của một công ty CNTT và cho một trường đại học vay tiền”, “Dữ liệu lớn giúp đỡ người vô gia cư”, “Công ty đã cam kết trả 5 triệu USD cho một tòa nhà học thuật mới”.

Tôi có phải là người duy nhất thấy điều này khó chịu không?


Chương trình được thực hiện vào năm 2005-2009 và hoạt động tốt trên Windows XP. Trong hơn phiên bản mới nhất chương trình Windows có thể bị đóng băng, điều này là không thể chấp nhận được đối với một người không thể đứng dậy khỏi ghế và khởi động lại nó. Vì thế chương trình phải được làm lại.

Không có văn bản nguồn, chỉ có các ấn phẩm riêng lẻ tiết lộ các công nghệ dựa trên nó (MFCC, MLP - đọc về điều này trong phần thứ hai).

Nó được viết bằng hình ảnh và sự giống nhau chương trình mới(khoảng ba tháng).

Trên thực tế, bạn có thể thấy nó hoạt động như thế nào:

Tải xuống chương trình và/hoặc xem mã nguồn Có thể .

Bạn không cần thực hiện bất kỳ hành động đặc biệt nào để cài đặt chương trình, chỉ cần nhấp vào nó và chạy nó. Điều duy nhất là trong một số trường hợp, nó phải được chạy với tư cách quản trị viên (ví dụ: khi làm việc với bàn phím ảo“Phím thoải mái Pro”):

Có lẽ đáng đề cập ở đây những điều khác mà trước đây tôi đã làm để có thể vận hành máy tính rảnh tay.

Nếu bạn có khả năng quay đầu, con quay hồi chuyển gắn trên đầu có thể là một lựa chọn thay thế tốt cho eViacam. Bạn sẽ có được vị trí con trỏ nhanh chóng và chính xác cũng như không phụ thuộc vào ánh sáng.

Nếu bạn chỉ có thể di chuyển đồng tử của mắt thì bạn có thể sử dụng thiết bị theo dõi hướng nhìn và chương trình dành cho nó (điều này có thể khó khăn nếu bạn đeo kính).

Phần II. Làm thế nào nó hoạt động?

Từ các tài liệu đã xuất bản về chương trình Vocal Joystick, người ta biết rằng nó hoạt động như sau:
  1. Cắt luồng âm thanh thành các khung hình 25 mili giây với độ chồng lấp 10 mili giây
  2. Nhận 13 hệ số epstral (MFCC) cho mỗi khung
  3. Xác minh rằng một trong 6 âm thanh được lưu trữ (4 nguyên âm và 2 phụ âm) được phát âm bằng nhận thức đa lớp (MLP)
  4. Chuyển âm thanh tìm thấy thành chuyển động/nhấp chuột
Nhiệm vụ đầu tiên chỉ đáng chú ý vì để giải quyết nó trong thời gian thực, ba luồng bổ sung phải được đưa vào chương trình, kể từ đọc dữ liệu từ micrô, xử lý âm thanh, phát âm thanh qua card âm thanh xảy ra không đồng bộ.

Nhiệm vụ cuối cùng được thực hiện đơn giản bằng cách sử dụng hàm SendInput.

Đối với tôi, có vẻ như vấn đề thứ hai và thứ ba được quan tâm nhiều nhất. Vì thế.

Nhiệm vụ số 2. Đạt được 13 hệ số cestral

Nếu ai chưa biết thì vấn đề chính của việc nhận dạng âm thanh bằng máy tính là như sau: rất khó để so sánh hai âm thanh, vì hai âm thanh này có hình dáng khác nhau. sóng âm nghe có vẻ giống nhau từ góc độ con người.

Và trong số những người liên quan đến nhận dạng giọng nói, có cuộc tìm kiếm “hòn đá triết gia” - một tập hợp các đặc điểm có thể phân loại sóng âm thanh một cách rõ ràng.

Trong số những tính năng có sẵn cho công chúng và được mô tả trong sách giáo khoa, tính năng được sử dụng rộng rãi nhất là Hệ số Cepstral Mel-Frequency (MFCC).

Lịch sử của chúng đến mức ban đầu chúng được thiết kế cho một mục đích hoàn toàn khác, cụ thể là để triệt tiêu tiếng vang trong tín hiệu (một bài báo mang tính giáo dục về chủ đề này được viết bởi Oppenheim và Schafer đáng kính, cầu mong niềm vui sẽ đến trong nhà của những người đàn ông quý tộc này. Xem A. V. Oppenheim và R. W. Schafer, “Từ tần số đến tần số: Lịch sử của Cepstrum”.

Nhưng con người được thiết kế theo cách mà anh ta có xu hướng sử dụng những gì anh ta biết rõ nhất. Và những người làm việc về tín hiệu giọng nói đã nảy ra ý tưởng sử dụng một biểu diễn nhỏ gọn làm sẵn của tín hiệu dưới dạng MFCC. Hóa ra, nói chung, nó hoạt động. (Một người bạn của tôi, một chuyên gia về hệ thống thông gió, khi tôi hỏi anh ấy cách làm một ngôi nhà mùa hè, đã đề xuất sử dụng các ống thông gió. Đơn giản vì anh ấy hiểu rõ về chúng hơn các vật liệu xây dựng khác).

MFCC có phải là công cụ phân loại tốt cho âm thanh không? Tôi sẽ không nói. Âm thanh tương tự, được tôi phát âm vào các micrô khác nhau, kết thúc bằng Những khu vực khác nhau không gian của các hệ số MFCC và một bộ phân loại lý tưởng sẽ xếp chúng cạnh nhau. Vì vậy, đặc biệt khi thay đổi micro phải đào tạo lại chương trình.

Đây chỉ là một trong những hình chiếu của không gian MFCC 13 chiều vào không gian 3 chiều, nhưng nó cũng thể hiện điều tôi muốn nói - các điểm màu đỏ, tím và xanh lam đều bắt nguồn từ micro khác nhau: (Plantronix, dãy micro tích hợp, Jabra), nhưng âm thanh chỉ được phát âm một mình.

Tuy nhiên, vì tôi không thể cung cấp bất cứ điều gì tốt hơn nên tôi cũng sẽ sử dụng phương pháp chuẩn– tính toán hệ số MFCC.

Để không mắc sai sót trong quá trình triển khai, trong các phiên bản đầu tiên của chương trình, mã từ giếng đã được sử dụng làm cơ sở. chương trình nổi tiếng CMU Sphinx, chính xác hơn là việc triển khai nó bằng C, được gọi là Pocketphinx, được phát triển tại Đại học Carnegie Mellon (cầu bình an cho cả hai! (c) Hottabych).

Mã nguồn Pocketphinx là mở, nhưng vấn đề là nếu bạn sử dụng chúng, bạn phải viết văn bản trong chương trình của mình (cả trong mã nguồn và trong mô-đun thực thi) có chứa, cùng với những thứ khác, những nội dung sau:

* Công việc này được hỗ trợ một phần bởi nguồn tài trợ từ Cơ quan Dự án Nghiên cứu * Phòng thủ Tiên tiến và Quỹ Khoa học Quốc gia của * Hợp chủng quốc Hoa Kỳ và Hiệp hội Ngôn ngữ Nhân sư CMU.
Điều này có vẻ không thể chấp nhận được đối với tôi và tôi phải viết lại mã. Điều này ảnh hưởng đến hiệu suất của chương trình (trong mặt tốt hơn Nhân tiện, mặc dù "khả năng đọc" của mã đã bị ảnh hưởng phần nào). Phần lớn nhờ vào việc sử dụng các thư viện “Intel Performance Primitives”, nhưng tôi cũng đã tự tối ưu hóa một số thứ, chẳng hạn như bộ lọc MEL. Tuy nhiên, thử nghiệm trên dữ liệu thử nghiệm cho thấy các hệ số MFCC thu được hoàn toàn giống với các hệ số thu được bằng cách sử dụng tiện ích sphinx_fe chẳng hạn.

Trong các chương trình sphinxbase, việc tính hệ số MFCC được thực hiện theo các bước sau:

Bước chân hàm nhân sư Bản chất của hoạt động
1 fe_pre_nhấn mạnh Hầu hết số đọc trước đó đều bị trừ khỏi số đọc hiện tại (ví dụ: 0,97 khỏi giá trị của nó). Một bộ lọc nguyên thủy loại bỏ tần số thấp.
2 fe_hamming_window Cửa sổ Hamming – giới thiệu sự suy giảm ở đầu và cuối khung
3 fe_fft_real Biến đổi Fourier nhanh
4 fe_spec2cường độ Từ phổ thông thường, chúng ta thu được phổ công suất, mất pha
5 fe_mel_spec Chúng tôi nhóm các tần số của phổ [ví dụ: 256 phần] thành 40 cột, sử dụng thang đo MEL và hệ số trọng số
6 fe_mel_ceep Chúng tôi lấy logarit và áp dụng phép biến đổi DCT2 cho 40 giá trị từ bước trước.
Chúng ta để lại 13 giá trị đầu tiên của kết quả.
Có một số biến thể của DCT2 (HTK, cũ, cổ điển), khác nhau ở hằng số mà chúng tôi chia các hệ số kết quả và một hằng số đặc biệt cho hệ số 0. Bạn có thể chọn bất kỳ tùy chọn nào, nó sẽ không thay đổi bản chất.

Các bước này cũng bao gồm các chức năng cho phép bạn tách tín hiệu khỏi nhiễu và im lặng, chẳng hạn như fe_track_snr, fe_vad_hangover, nhưng chúng tôi không cần chúng và chúng tôi sẽ không bị chúng phân tâm.

Các thay thế sau đây đã được thực hiện cho các bước để đạt được hệ số MFCC:

Nhiệm vụ số 3. Kiểm tra xem một trong 6 âm đã ghi nhớ có được phát âm không

Chương trình Vocal Joystick ban đầu sử dụng perceptron nhiều lớp (MLP) để phân loại - một mạng lưới thần kinh không có chuông và còi mới.

Hãy xem việc sử dụng hợp lý như thế nào mạng lưới thần kinhĐây.

Chúng ta hãy nhớ những gì tế bào thần kinh làm trong mạng lưới thần kinh nhân tạo.

Nếu một nơron có N đầu vào thì nơron đó sẽ chia không gian N chiều làm đôi. Chém trái tay với một siêu phẳng. Hơn nữa, ở một nửa không gian, nó hoạt động (đưa ra câu trả lời tích cực), nhưng ở nửa không gian khác thì nó không hoạt động.

Chúng ta hãy xem xét tùy chọn [thực tế] đơn giản nhất - một nơ-ron có hai đầu vào. Nó sẽ tự nhiên chia không gian hai chiều làm đôi.

Đặt đầu vào là các giá trị X1 và X2, mà nơ-ron nhân với các hệ số trọng số W1 và W2, đồng thời thêm thuật ngữ tự do C.


Tổng cộng, ở đầu ra của nơ-ron (chúng ta ký hiệu là Y), chúng ta nhận được:

Y=X1*W1+X2*W2+C

(Bây giờ chúng ta hãy bỏ qua phần tinh tế về hàm sigmoid)

Chúng ta coi nơ-ron hoạt động khi Y>0. Đường thẳng cho bởi phương trình 0=X1*W1+X2*W2+C chia không gian một cách chính xác thành phần có Y>0 và phần có Y<0.

Hãy để chúng tôi minh họa những gì đã được nói bằng những con số cụ thể.

Đặt W1=1, W2=1, C=-5;

Bây giờ chúng ta hãy xem cách chúng ta có thể tổ chức một mạng lưới thần kinh có thể hoạt động trong một khu vực không gian nhất định, nói một cách tương đối, một điểm và không hoạt động ở tất cả những nơi khác.

Có thể thấy từ hình vẽ rằng để phác thảo một khu vực trong không gian hai chiều, chúng ta cần ít nhất 3 đường thẳng, tức là có 3 nơ-ron kết nối với chúng.

Chúng ta sẽ kết hợp ba nơ-ron này lại với nhau bằng cách sử dụng một lớp khác để tạo ra một mạng nơ-ron nhiều lớp (MLP).

Và nếu chúng ta cần mạng nơ-ron hoạt động trong hai vùng không gian, thì chúng ta sẽ cần thêm ít nhất ba nơ-ron nữa (4,5,6 trong hình):

Và ở đây bạn không thể làm gì nếu không có lớp thứ ba:

Và lớp thứ ba gần như là Deep Learning…

Bây giờ hãy chuyển sang một ví dụ khác để được trợ giúp. Hãy để mạng lưới thần kinh của chúng ta tạo ra phản hồi tích cực trên các chấm màu đỏ và phản hồi tiêu cực trên các chấm màu xanh lam.

Nếu tôi được yêu cầu cắt màu đỏ từ màu xanh theo đường thẳng, tôi sẽ làm như thế này:

Nhưng mạng lưới thần kinh không biết trước bao nhiêu mạng lưới thần kinh trực tiếp (nơ-ron) sẽ cần. Tham số này phải được đặt trước khi huấn luyện mạng. Và một người làm điều này dựa trên... trực giác hoặc thử và sai.

Nếu chúng ta chọn quá ít nơ-ron ở lớp đầu tiên (ví dụ như ba), chúng ta có thể có một vết cắt như thế này, điều này sẽ gây ra rất nhiều lỗi (vùng sai sót được tô bóng):

Nhưng ngay cả khi số lượng nơ-ron đủ, do quá trình huấn luyện, mạng có thể “không hội tụ”, tức là đạt đến trạng thái ổn định nào đó, xa mức tối ưu, khi tỷ lệ lỗi cao. Giống như ở đây, thanh ngang trên cùng nằm trên hai bướu và không di chuyển ra khỏi chúng. Và bên dưới có một vùng rộng phát sinh lỗi:

Một lần nữa, khả năng xảy ra những trường hợp như vậy phụ thuộc vào điều kiện đào tạo ban đầu và trình tự đào tạo, nghĩa là vào các yếu tố ngẫu nhiên:

- Bạn nghĩ sao, nếu xảy ra bánh xe đó liệu có đến được Moscow hay không?
- Bạn nghĩ sao, mạng lưới thần kinh có hoạt động được hay không?

Có một khoảnh khắc khó chịu khác liên quan đến mạng lưới thần kinh. “Sự quên lãng” của họ.

Nếu bạn bắt đầu chỉ cung cấp cho mạng các chấm màu xanh và ngừng cung cấp các chấm màu đỏ, thì mạng có thể dễ dàng lấy một phần của vùng màu đỏ cho chính nó, di chuyển các đường viền của nó đến đó:

Nếu mạng lưới thần kinh có rất nhiều thiếu sót và một người có thể vẽ ranh giới hiệu quả hơn nhiều so với mạng lưới thần kinh, thì tại sao lại sử dụng chúng?

Và có một chi tiết nhỏ nhưng rất quan trọng.

Tôi có thể tách rất rõ trái tim màu đỏ khỏi nền xanh bằng các đoạn thẳng trong không gian hai chiều.

Tôi có thể tách biệt khá rõ bức tượng Thần Vệ Nữ khỏi không gian ba chiều bao quanh nó bằng các mặt phẳng.

Nhưng trong không gian bốn chiều, tôi không thể làm gì được, xin lỗi. Và ở chiều thứ 13 - thậm chí còn hơn thế nữa.

Nhưng đối với mạng lưới thần kinh, chiều không gian không phải là trở ngại. Tôi đã cười nhạo cô ấy trong không gian nhỏ, nhưng ngay khi tôi vượt quá mức bình thường, cô ấy đã dễ dàng hạ gục tôi.

Tuy nhiên, câu hỏi vẫn còn bỏ ngỏ: việc sử dụng mạng thần kinh trong nhiệm vụ cụ thể này hợp lý đến mức nào, có tính đến những nhược điểm của mạng thần kinh được liệt kê ở trên.

Chúng ta hãy tạm quên rằng các hệ số MFCC của chúng ta nằm trong không gian 13 chiều và hãy tưởng tượng rằng chúng là hai chiều, tức là các điểm trên một mặt phẳng. Làm thế nào người ta có thể tách âm thanh này khỏi âm thanh khác trong trường hợp này?

Giả sử các điểm MFCC của âm thanh 1 có độ lệch chuẩn R1, [đại khái] có nghĩa là những điểm không lệch quá xa so với giá trị trung bình, những điểm đặc trưng nhất, nằm bên trong một vòng tròn có bán kính R1. Tương tự như vậy, các điểm mà chúng ta tin tưởng vào âm 2 nằm bên trong một đường tròn có bán kính R2.

Chú ý, câu hỏi: vẽ đường thẳng ở đâu để tách âm 1 khỏi âm 2 tốt nhất?

Câu trả lời tự nó gợi ý: ở giữa ranh giới của các vòng tròn. Một vài đối tượng? Không có phản đối.
Điều chỉnh: Trong chương trình, ranh giới này chia đoạn nối tâm của các đường tròn theo tỷ lệ R1:R2, điều này đúng hơn.

Và cuối cùng, chúng ta đừng quên rằng ở đâu đó trong không gian có một điểm tượng trưng cho sự im lặng hoàn toàn trong không gian MFCC. Không, nó không phải là 13 số 0 như bạn tưởng. Đây là một điểm không thể có độ lệch chuẩn. Và các đường thẳng mà chúng ta cắt nó khỏi ba âm thanh của mình có thể được vẽ trực tiếp dọc theo ranh giới của các vòng tròn:

Trong hình bên dưới, mỗi âm thanh tương ứng với một phần không gian có màu sắc riêng và chúng ta luôn có thể nói một điểm cụ thể trong không gian thuộc về âm thanh nào (hoặc không thuộc về âm thanh nào):

Được rồi, bây giờ chúng ta hãy nhớ rằng không gian là 13 chiều, và những gì tốt để vẽ trên giấy giờ đây hóa ra lại là thứ không phù hợp với bộ não con người.

Vâng, nhưng không phải vậy. May mắn thay, trong không gian của bất kỳ chiều nào vẫn còn tồn tại những khái niệm như điểm, đường thẳng, [siêu] mặt phẳng, [siêu] cầu.

Chúng tôi lặp lại tất cả các hành động tương tự trong không gian 13 chiều: chúng tôi tìm độ phân tán, xác định bán kính của các quả cầu [siêu], nối tâm của chúng bằng một đường thẳng, cắt nó bằng một mặt phẳng [siêu] tại một điểm cách đều mặt phẳng ranh giới của các quả cầu [siêu].

Không có mạng lưới thần kinh nào có thể phân tách âm thanh này với âm thanh khác một cách chính xác hơn.

Tuy nhiên, ở đây nên đặt trước. Tất cả điều này đều đúng nếu thông tin về âm thanh là một đám mây gồm các điểm lệch khỏi mức trung bình như nhau theo mọi hướng, nghĩa là nó rất phù hợp với siêu cầu. Nếu đám mây này là một hình có hình dạng phức tạp, chẳng hạn như một chiếc xúc xích cong 13 chiều, thì tất cả những lý luận trên sẽ không chính xác. Và có lẽ, nếu được đào tạo phù hợp, mạng lưới thần kinh có thể phát huy được điểm mạnh của mình ở đây.

Nhưng tôi sẽ không mạo hiểm. Và tôi sẽ sử dụng, ví dụ, các tập hợp phân phối chuẩn (GMM), (nhân tiện, điều này được thực hiện trong CMU Sphinx). Sẽ dễ chịu hơn khi bạn hiểu thuật toán cụ thể nào dẫn đến kết quả. Không giống như trong mạng lưới thần kinh: Oracle, dựa trên dữ liệu huấn luyện trong nhiều giờ, sẽ yêu cầu bạn quyết định rằng âm thanh được yêu cầu là âm thanh số 3. (Tôi đặc biệt khó chịu khi họ cố gắng giao quyền điều khiển ô tô cho mạng lưới thần kinh. Làm thế nào mà trong một tình huống bất thường, người ta có thể hiểu tại sao ô tô lại rẽ trái mà không rẽ phải? Thần kinh toàn năng có ra lệnh không?).

Nhưng tập hợp phân phối chuẩn là một chủ đề lớn riêng biệt nằm ngoài phạm vi của bài viết này.

Tôi hy vọng rằng bài viết này hữu ích và/hoặc khiến bạn phải rùng mình.

Người đam mê nào lại không mơ ước được điều khiển máy tính từ ghế dài chỉ bằng cử chỉ và lệnh thoại? Thật kỳ lạ, nhưng điều này đã có thể thực hiện được. Và trong tương lai rất gần, cứ mỗi giây sẽ có một người vẫy tay trước màn hình. Bài viết thảo luận về một số phương pháp và triển vọng trước mắt.

Điều khiển bằng giọng nói trên Windows

Hãy bắt đầu với phần mềm miễn phí cho phép bạn điều khiển máy tính của mình bằng giọng nói tiếng Nga. Có thể thuyết phục anh ta mở chương trình, thực hiện một số hành động, v.v. Và đôi tay của bạn sẽ được tự do cho những việc quan trọng hơn.

Kiểu

Chương trình này dẫn đầu trong số các chương trình cho phép bạn điều khiển máy tính bằng tiếng Nga mẹ đẻ của mình. Sau khi cài đặt, bạn sẽ cần tạo một người dùng và đưa ra từ khóa như “Ok, Windows”, mặc dù chúng tôi khuyên bạn nên sử dụng từ “Mở”. Đây là lúc chúng ta bắt đầu nói chuyện, một cách triển khai quen thuộc trong Google Glasses đã tồn tại.

Sau đó chúng tôi chọn lệnh cho người dùng. Bạn chỉ có thể thêm phần khởi chạy của một số chương trình và khi nhấp vào, bạn cũng có thể chọn chương trình và thêm đối số. Có lẽ nếu bạn thêm điều gì đó vào buổi ra mắt chương trình thì sẽ có những hành động. Nhưng nhìn chung, người dùng bình thường sẽ không thể điều khiển hoàn toàn máy tính, không cần tạm dừng hay chuyển bài tiếp theo mà chỉ bắt đầu và bắt đầu.

Điều khiển bằng cử chỉ trên máy tính

Kể từ khi PlayStation®Eye Camera và kinect ra đời, mọi người đều mong muốn có những tính năng tương tự trên máy tính của mình. Sau đó, Kinect thậm chí còn được bán cho các nhà phát triển, nhưng một sản phẩm như vậy không được công bố cho người dùng phổ thông. Và thậm chí còn có tin Kinect 2.0 với Xbox One sẽ không hoạt động trên máy tính mà một phiên bản đặc biệt của Kinect sẽ được phát hành cho PC. Đúng, nếu không có phần mềm thích hợp thì nó sẽ ít được sử dụng. Vì vậy, hãy chuyển sang phần mềm.

Cách phổ biến và dễ tiếp cận nhất để kiểm soát cử chỉ là chương trình Flutter và tiện ích mở rộng tương ứng của Chrome. Hầu như bất kỳ webcam nào cũng sẽ hoạt động với chương trình này.

Khá nhiều chức năng, nhưng chúng hoạt động rất tốt. Chúng ta có thể tạm dừng và tiếp tục giơ lòng bàn tay của mình ra. Chuyển bài hát hoặc video sang trái hoặc phải, tùy thuộc vào vị trí bạn trỏ ngón tay. Chương trình hoạt động trong PowerPoint, VLC, Winamp, iTunes, YouTube và một số dịch vụ khác mà ít người sử dụng.

Để hoạt động bình thường, bạn nên đặt nó ở khoảng cách xa với webcam, nhưng không được làm ngẫu nhiên. Nằm xuống hóa ra khó kiểm soát hơn nhiều so với ngồi thẳng. Cá nhân tôi chỉ sử dụng nó trên YouTube khi tay bẩn, nó khá tiện lợi hoặc khi bạn đang nằm. Vẫn chưa có chuyển động ngẫu nhiên nào. Nhưng vẫn có những sai lầm khi bạn chỉ ngồi và vẫy tay trước màn hình như một kẻ ngốc.

Chắc chắn Flutter sẽ sớm nhận được sự hỗ trợ đầy đủ cho Chrome, vì startup này đã được Google mua lại vào tháng 10 năm 2013.

Chuyển động nhảy vọt

Hãy chuyển từ phần mềm sang thiết bị. Leap Motion truyền cảm hứng cho sự tự tin với quy mô nhỏ và tiềm năng lớn. Thứ này phát hiện bàn tay của người dùng, hay nói đúng hơn là thậm chí từng ngón tay. Cửa hàng của riêng bạn với hàng loạt ứng dụng và trò chơi sẽ không khiến bạn cảm thấy nhàm chán. Và quan trọng nhất, nó đã được bán và có giá khoảng 5.000 rúp. Không nhiều cho phép thuật như vậy.

Nhưng trên thực tế, ở đây có rất nhiều nhược điểm. Đã có những cuộc thảo luận trên trung tâm và thậm chí cả ý kiến ​​của một trong những người dùng. Bạn phải luôn để tay với cổ tay hướng lên trên thiết bị, bạn nghĩ điều đó có dễ không? Giữ trong 5 phút.

Về phần ứng dụng, cũng có một điểm trừ lớn là tất cả những ứng dụng miễn phí đều có lỗi và bị treo. Và trò chơi là một loạt các chuyến đi LSD khó hiểu. Và thật bất tiện khi điều khiển, độ chính xác lại diễn ra theo hướng ngược lại và mỗi cử động tay không chính xác đều dẫn đến hậu quả không lường trước được.

Và chính trình điều khiển cho Leap Motion sẽ ngốn gần như toàn bộ tài nguyên trên máy tính của bạn. Nhưng nếu điều này không ngăn cản bạn, thì hãy mua, như mọi khi, tại văn phòng. trang mạng. Nó thậm chí còn bằng tiếng Nga.

ĐÔI 3D

Công nghệ tương tự từ các nhà phát triển Nga cũng tồn tại. Họ chỉ cần lấy hai chiếc Eye Camera, viết phần mềm và thành lập công ty trên Kickstarter. Thật không may, đó là một thất bại. Chúng tôi đã huy động được 62.000 đô la trong số 110.000 đô la dự kiến. Thật đáng tiếc, đặc biệt là khi họ thậm chí sẽ không nhận được số tiền này, vì mọi thứ cần phải được thu thập để có thể đến nơi.

Giờ đây, các thiết bị này thậm chí còn được cung cấp miễn phí, nhưng chúng tôi hy vọng rằng sự phát triển như vậy của con người chúng tôi sẽ không biến mất.

Myo

Thôi nào, ai chưa nghe nói về Myo. Vòng đeo tay phát hiện cử chỉ không sử dụng máy ảnh giống như các đối thủ cạnh tranh mà bằng cách nhận biết chuyển động của cơ. Video đẹp mắt và các tính năng tuyệt vời đã thu hút tất cả mọi người, kể cả tôi. Ngay sau khi chiếc vòng tay được giảm giá, các ứng dụng và tất cả sự tích hợp sẽ được biết đến, các bài đánh giá sẽ xuất hiện, khi đó tôi sẽ mua thứ tuyệt vời này.

Bây giờ chiếc vòng tay có thể được đặt hàng trước với giá 150 USD, nhưng tôi ngại mua phiên bản thô.

Điều khiển máy tính từ webcam trên laptop

Ngày nay, các nhà sản xuất máy tính xách tay thích thử nghiệm điều khiển bằng cử chỉ. Công ty PointGrab đã đạt được tiến bộ trong chủ đề này; ý tưởng nghệ thuật của họ khá lạc quan.

Acer sử dụng sản phẩm của hãng này. Và Lenovo sẽ tạo ra Motion Control 2.0 của riêng mình dựa trên những phát triển này.

Và vào tháng 9 năm 2013, Intel đã công bố những chiếc máy tính xách tay mới có khả năng điều khiển bằng giọng nói, điều khiển bằng cử chỉ và cảm ứng, và trước đó vào mùa hè, công ty đã mua lại công ty khởi nghiệp Omek của Israel.

Hãy xem điều gì xảy ra sau tất cả những điều này. Gần đây tôi luôn có cảm giác rằng tương lai đã đến gần và đã như vậy được vài năm rồi. Bạn có thể bổ sung kiến ​​thức của mình vào tài liệu của tôi không?Có thiết bị hoặc phương pháp nào khác cũng đáng được đề cập không?