Trình soạn thảo văn bản Utf 8. Vấn đề với mã hóa. Abracadabra trong một trình soạn thảo văn bản. Những plugin nào cho Notepad bạn có thể cần trong công việc của mình



trình chuyển đổi văn bản unicode (19)

Bạn chỉ có thể sử dụng Notepad.exe với phông chữ Arial Unicode MS (nếu tất cả văn bản được viết từ trái sang phải, dựa trên phiên bản tiếng Anh của Windows). Chỉ cần chọn "Save As", chọn "UTF-8".

Nói chung, hãy sử dụng trình soạn thảo yêu thích của bạn với phông chữ như "Arial Unicode MS". Tôi đề cập đến điều này vì đây là phông chữ bao phủ Unicode nhất mà tôi từng thấy,

Tôi đang tìm một trình soạn thảo văn bản (đơn giản) có thể xử lý văn bản ở các bảng mã khác nhau trong cùng một tài liệu.

Tôi cần phát triển một số trang web có văn bản hỗn hợp tiếng Nhật và tiếng Anh và các trình soạn thảo mà tôi hiện có (trên hệ thống Windows tiếng Anh) không thể hiển thị văn bản tiếng Nhật. File Jedit không hiển thị văn bản tôi nhập nhưng khi tôi xem file trên trình duyệt thì nó hiển thị chính xác. Gvim hiển thị tất cả văn bản tiếng Nhật trong trình chỉnh sửa dưới dạng dấu chấm hỏi và cả trong trình duyệt. Gvim nhập chữ kanji hoạt động (bạn nhập cách phát âm rồi nhấn phím cách để lấy chữ kanji), nhưng khi xác thực một chữ kanji, bạn muốn nó thay thế chữ kanji đó bằng dấu chấm hỏi. (1 dấu chấm hỏi cho mỗi chữ Hán).

Sau khi đọc về emacs tôi đã cài đặt nó. Xem bên dưới.

Cám ơn tất cả mọi người cho lời khuyên. nếu chưa có phông chữ unicode, bạn nên tìm trên mạng hoặc mua một phông chữ. Dưới đây là hướng dẫn cài đặt phông chữ trên hệ thống Windows http://support.microsoft.com/kb/314960

jEdit Tôi đã thay đổi phông chữ của mình trong Jedit thành phông chữ UTF và bây giờ tiếng Nhật có vẻ ổn. gõ tiếng Nhật vẫn có vấn đề vì bạn không thể nhìn thấy mình đang gõ gì. (để thay đổi phông chữ để chỉnh sửa tệp, hãy vào Tiện ích -> Tùy chọn chung -> Vùng văn bản, chọn phông chữ Unicode và bạn sẽ có thể nhìn thấy các ký tự tiếng Nhật.

gVim Tôi vẫn đang tìm cách thêm phông chữ vào gvim. Ngay khi tôi biết cách thực hiện việc này, tôi sẽ cập nhật điều này.

Emacs Emacs không hiển thị chính xác chữ kanji, chúng được hiển thị dưới dạng ??? nhưng ít nhất tôi có thể thấy rằng tôi đang gõ tiếng Nhật và chọn đúng từ.

vì vậy tại thời điểm này tôi phải nói rằng trong jEdit tôi có thể thấy văn bản tiếng Nhật, nhưng tôi không thể nhập văn bản tiếng Nhật. Gvim Tôi có thể nhập văn bản tiếng Nhật, nhưng bên trong vùng văn bản nó hiển thị là ??? và điều tương tự cũng xảy ra với Emacs. Thật không may, việc thêm phông chữ vào emacs và gvim không phải là một nhiệm vụ tầm thường. Tôi hiện đang sử dụng notepad với phông chữ MS Arial Unicode và lưu nó dưới dạng tệp UTF-8 làm trình soạn thảo tiếng Nhật của mình. Không hoàn hảo, nhưng ít nhất nó hoạt động.

Tôi thích jEdit vì khả năng xác định các chuỗi được bọc. Rất đẹp khi chỉnh sửa các tập tin XML. Tuy nhiên, xin cảnh báo: Đây là Java, vì vậy nó không phải là một trình soạn thảo văn bản nhẹ nhàng như bạn mong đợi.

Codec văn bản được hỗ trợ đầy đủ. Nó phân biệt giữa các tệp văn bản có và không có tiêu đề chỉ định định dạng tệp (dấu thứ tự byte), gọi chúng là UTF-8 và UTF-8Y. Đây là điều tôi nhớ ở các trình soạn thảo văn bản khác.

EditPad Lite và Pro hỗ trợ đầy đủ Unicode kể từ phiên bản 6.

Nếu bạn nhận được dấu chấm hỏi thì bạn đang sử dụng bảng mã không hỗ trợ ký tự tiếng Nhật. Trong EditPad, bạn có thể thay đổi mã hóa văn bản (Unicode, các trang mã cũ) bằng Chuyển đổi, Mã hóa văn bản. Bạn có thể đặt mặc định cho từng loại tệp trong Tùy chọn, Tùy chỉnh loại tệp, Mã hóa.

Nếu bạn thấy hình vuông thay vì ký tự tiếng Nhật, hãy chọn phông chữ Japanse hoặc Unicode. Bạn có thể thực hiện việc này trong EditPad thông qua Tùy chọn, Phông chữ.

Để gõ tiếng Nhật, chỉ cần cài đặt trình điều khiển bàn phím tiếng Nhật trong Cài đặt bàn phím trong Bảng điều khiển Windows nếu bạn chưa cài đặt.

EditPad Pro có các loại tệp được cấu hình sẵn cho PHP và HTML.

Chỉ cần thêm một điều nữa: Tôi vừa kiểm tra xem Notepad 2 của Lập trình viên có một số cài đặt UTF-8 hay không.

(vim và emacs cũng rất tốt)

Để chỉnh sửa văn bản rất cơ bản bằng nhiều ngôn ngữ UTF-8, tôi đã rất may mắn với BabelPad (www.babelstone.co.uk): nó miễn phí, đơn giản và đáng tin cậy, đồng thời hiển thị hầu hết mọi thứ mà không gặp bất kỳ phiền toái nào. Khi nhu cầu chỉnh sửa của tôi nghiêm túc hơn, tôi sử dụng EditPad Pro hoặc đôi khi là Notepad++ rất nhiều. Để chỉnh sửa không phải Unicode trên Windows, tôi là người dùng TextPad - nhân viên của tôi - và có lẽ tôi đã dành khoảng 200.000 giờ trong TextPad, chỉ thỉnh thoảng mới chuyển sang NotePad2, MadEdit, jEdit, XML Copy Editor và EPCedit. Hai cái cuối cùng xử lý tốt các tệp XML UTF-8. Tất cả các trình soạn thảo được đề cập ở trên đều miễn phí ngoại trừ TextPad và EditPad Pro. Cảm ơn người đã gợi ý Emeditor. Tôi sẽ thử. --PFSchaffner

Có vẻ như vấn đề với Jedit là phông chữ - bạn có đang sử dụng phông chữ có thể hiển thị chính xác tất cả các ký tự không?

Nói chính xác hơn, Arial Unicode MS là sự lựa chọn hợp lý cho một phông chữ Unicode có thể hiển thị nhiều loại ký tự trên nhiều ngôn ngữ. Có một số vấn đề với nó có thể khiến nó kém tối ưu đối với một số ngôn ngữ được sử dụng riêng biệt - đó là lý do tại sao Windows cũng có các phông chữ Unicode dành riêng cho ngôn ngữ.

Hãy thử EditPlus. Nó có hỗ trợ HTML chuyên dụng, tô sáng cú pháp và cũng có thể hoạt động như một khung đơn giản cho bất kỳ trình biên dịch nào.

EmEditor được một công ty Nhật Bản viết riêng cho mục đích này. Đó là một trình soạn thảo văn bản tốt với hiệu suất tốt/đơn giản nhưng hầu như có tất cả các tính năng mà bạn mong đợi từ một trình soạn thảo có khả năng; Tôi sử dụng nó theo mặc định khi sử dụng nền tảng Windows và cũng để chỉnh sửa các mẫu trang web tiếng Nhật. Anh ấy xứng đáng được IMO biết đến nhiều hơn; ít nhất nó cũng tốt như TextPad, nhưng có hỗ trợ Unicode đầy đủ.

Rất tiếc, nó không miễn phí, tuy nhiên bạn có thể tìm thấy phiên bản miễn phí của EmEditor 6 cũ trên các trang web như download.com.

Emacs xử lý UTF-8 chính xác cho tôi. (Và tất nhiên là nó có thể chỉnh sửa các file HTML và PHP).

Vim hoạt động tốt với tôi như một trình soạn thảo văn bản UTF-8.

Trước hết, bạn cần một phông chữ có các ký tự bạn đang sử dụng. Việc chọn một trình soạn thảo văn bản khác sẽ không giúp ích gì cho bạn (trừ khi nó tìm các phông chữ khác để tìm đúng ký tự khi phông chữ bạn đang sử dụng không có chúng). Nếu bạn đang sử dụng gVim, bạn có thể đặt phông chữ như thế này:

Đặt guifont=Consolas

(Điều này không có nghĩa là Consolas là phông chữ phù hợp.) Có thể bạn sẽ muốn đặt phông chữ này vào tệp .vimrc để nó luôn được sử dụng.

Thứ hai, Vim nên hiểu tệp là UTF-8, điều này không phải lúc nào cũng tự động thực hiện. Để làm điều này, hãy làm như sau:

Đặt mã hóa=utf8

Bạn cũng có thể tìm hiểu xem nó sử dụng mã hóa nào:

Có một vấn đề với hầu hết các trình soạn thảo văn bản hỗ trợ Unicode: khi bạn chọn một phông chữ, chúng sẽ bám theo phông chữ đó. Nếu phông chữ không chứa glyph cho một ký tự thì ký tự thay thế mặc định sẽ được sử dụng (tôi tin rằng U+FFFD, KÝ TỰ THAY THẾ).

Ngược lại, các trình duyệt web thường cố gắng tìm một glyph cho các ký tự mà chúng được cho là sẽ hiển thị trong số tất cả các phông chữ do hệ thống cung cấp.

Vì vậy, những gì bạn cần, nếu bạn không có phông chữ "Arial Unicode MS" hoặc phông chữ tương tự (bao gồm cả các ký tự tiếng Nhật), thì là một trình soạn thảo cố gắng khớp các ký tự với các phông chữ khác với phông chữ bạn chọn.

  • Cài đặt phiên bản ổn định mới nhất của python 2.x cho MS Windows (hiện tại là 2.6).
  • Kích hoạt "thời gian chết" trong quá trình cài đặt.
  • Bắt đầu → Chương trình → Python 2.6 → Nhàn rỗi (Python Gui)

Trình soạn thảo "nhàn rỗi" thường được sử dụng để chỉnh sửa mã python (và kiểm tra nó một cách tương tác trong trình bao Python). Tuy nhiên, nó có thể được sử dụng như một trình soạn thảo văn bản thông thường với mã Unicode có độ dài đầy đủ và khi lưu văn bản, bao gồm các ký tự không phải ASCII, mã hóa mặc định là UTF-8.

Bây giờ nhàn rỗi dựa trên Tkinter, là giao diện cho tk, là thư viện gui cho tcl; tcl/tk, ví dụ: trình duyệt web, khi được yêu cầu hiển thị một ký tự không có glyph trong phông chữ, nó cũng sẽ tìm các phông chữ khác.

Dù có vẻ kỳ lạ nhưng tôi thực sự tin rằng điều này sẽ hữu ích; nếu không có giải pháp nào khác giúp bạn, hãy thử nó.

Kate. và ngoài ra, bất kỳ chương trình KDE nào khác sử dụng Kate làm KPart tích hợp (KWrite, Quanta+, KDevelop). Nó xử lý rất nhiều mã hóa, nhưng tôi thích luôn sử dụng UTF-8. Nó cũng có một bộ sưu tập lớn các cú pháp tô sáng.

Tôi chưa bao giờ gặp vấn đề với vim miễn là tôi sử dụng phông chữ thực sự chứa các ký tự tôi cần. Nó phải là một phông chữ đơn cách. : Đặt enc=utf8 để chuyển sang chế độ utf8. Sau đó, bạn có thể sử dụng lệnh: digraph để hiển thị các ký hiệu có sẵn và xem chúng được hiển thị như thế nào.

Để thêm phông chữ, hãy thêm phông chữ đó vào Windows (Bảng điều khiển/Phông chữ/Thêm phông chữ). Nếu là phông chữ đơn cách, nó sẽ xuất hiện dưới dạng vin trong /Edit/Font.

Xin chào các độc giả thân mến của blog của tôi!

Trong bài viết này, tôi muốn kể cho bạn nghe về một chương trình miễn phí tuyệt vời mà tôi sử dụng để chỉnh sửa các tệp (HTML, PHP và văn bản) của blog WordPress. Làm thế nào để sử dụng Notepad++? Tôi nên sử dụng mã hóa nào cho blog WordPress của mình? Những vấn đề gì có thể phát sinh khi sử dụng mã hóa WordPress không chính xác? Bạn sẽ tìm thấy câu trả lời cho những câu hỏi này và những câu hỏi khác từ bài viết này.

Trước khi chuyển sang trình soạn thảo văn bản notepad++, tôi sẽ cho bạn biết về mã hóa văn bản.

Mã hóa WordPress. UTF-8 là gì?

Các chữ cái mà bạn nhìn thấy trên màn hình bây giờ không gì khác hơn là các giá trị số được lưu trữ trong tệp văn bản. Máy tính, hay đúng hơn là trình soạn thảo văn bản hoặc trình duyệt, chuyển đổi những số này thành ký tự (chữ cái, số và các ký tự khác) mà chúng ta nhìn thấy trên màn hình theo tiêu chuẩn mã hóa.

Ngày nay có một số lượng đáng kể các tiêu chuẩn đã được phát triển cho nhiều ngôn ngữ khác nhau. Tất cả các tiêu chuẩn khác nhau và chứa các bộ ký tự khác nhau.

Tôi sẽ không mô tả lịch sử phát triển của mã hóa văn bản và các loại của chúng, tôi sẽ chỉ nói rằng việc sử dụng chúng đã dẫn đến một vấn đề quan trọng - hiển thị các ký tự không chính xác (krakozyabry).

Để tránh xuất hiện các vết nứt khi sử dụng các bảng mã khác nhau, một bảng mã phổ quát đã được phát minh có chứa số lượng ký tự tối đa. Mã hóa này được gọi là Unicode.

Ngày nay, mã hóa Unicode tiên tiến và tối ưu nhất là UTF-8, đây là ví dụ về mã hóa này:

Tại sao UTF-8 không có BOOM? Những vấn đề gì có thể phát sinh khi sử dụng mã hóa sai?

Khi mã hóa UTF phát triển, họ đã thêm khả năng viết các ký tự theo cả chuỗi trực tiếp (ví dụ: C2AD) và theo chuỗi ngược lại (ADC2). Để các chương trình biết thứ tự đọc mã, BOOM (Byte Order Mark) đã được phát minh. Chữ ký này đã thêm ba byte bổ sung vào phần đầu của tài liệu.

Mã hóa UTF-8 không cung cấp BOOM, đó là lý do tại sao một số chương trình không thể đọc mã hóa Unicode đúng cách, dẫn đến hiển thị các ký hiệu tồi tệ (ký tự không thể đọc được) trên màn hình.

Đó là lý do tại sao, để hiển thị chính xác văn bản và các ký tự khác, cần sử dụng mã hóa UTF-8 (không có BOOM) trên blog WordPress.

Nhân tiện, tôi sẽ nói rằng việc sử dụng các mã hóa khác trên blog và sự hiện diện của chữ ký BOOM trong chúng không chỉ có thể ảnh hưởng đến việc hiển thị các ký tự mà còn dẫn đến những hậu quả khác nghiêm trọng hơn, chẳng hạn như .

Khi chỉnh sửa văn bản và mã (ví dụ: trong tệp mẫu WordPress), mã hóa được đặt trong chương trình được sử dụng để chỉnh sửa. Nếu chúng tôi thực hiện tất cả các hành động chỉnh sửa mã và văn bản trực tiếp trong , thì sẽ không có gì xấu xảy ra, vì tất cả các tệp sẽ được lưu ở dạng mã hóa được sử dụng trên blog, trong trường hợp của chúng tôi là UTF-8 (không có BOOM).

Nhưng việc chỉnh sửa như vậy không phải lúc nào cũng thuận tiện và làm mất đi nhiều chức năng hữu ích sẽ có khi chỉnh sửa các tệp này trên máy tính và tôi sẽ đề cập đến sau trong bài viết này.

Nếu bạn chỉnh sửa tệp mẫu blog thì bạn cần lưu chúng ở dạng mã hóa UTF-8 (không có BÙM).

Thật không may, không thể thực hiện việc này bằng các công cụ Windows tiêu chuẩn. Cùng một notepad, khi được lưu, sẽ thêm chữ ký BOOM vào các tệp đã lưu, do đó có thể phát sinh sự cố trên máy chủ, có thể dẫn đến xuất hiện các vết nứt và các hậu quả khó chịu khác.

Vì vậy, đừng bao giờ sử dụng Notepad và các chương trình tương tự để làm việc với các file blog nếu bạn không muốn gặp vấn đề.

Cá nhân tôi sử dụng Notepad++ để chỉnh sửa các tệp blog, cho phép bạn lưu tệp ở dạng mã hóa được yêu cầu.

Tôi có thể tải xuống Notepad++ ở đâu? Các tính năng và khả năng của notepad++ khi chỉnh sửa HTML, PHP và các mã khác.

Nếu bạn so sánh chương trình notepad++ với trình soạn thảo văn bản Notepad tiêu chuẩn, được tích hợp trong tất cả các hệ điều hành Windows, bạn sẽ thấy rằng chúng khác nhau như trời với đất. Trên thực tế, notepad là một trình soạn thảo văn bản ("trần") thông thường, thực tế không có chức năng nào, ngoại trừ các chức năng tiêu chuẩn (sao chép, dán, in và một số tính năng khác), nói chung, chức năng của chương trình này còn nhiều điều chưa được thực hiện. mong muốn.

Ngược lại, trình soạn thảo văn bản notepad++ có nhiều chức năng rất hữu ích và phổ biến mà bây giờ tôi sẽ nói đến.

Bạn có thể tải xuống phiên bản mới nhất của trình soạn thảo văn bản notepad++ trên trang web của nhà phát triển bằng cách nhấp vào liên kết này.

Việc cài đặt chương trình rất đơn giản, không có khó khăn gì phát sinh.

Cửa sổ chương trình trông như thế này:

Nếu cần, bạn có thể tải xuống phiên bản di động của trình soạn thảo văn bản - notepad++ di động, cho phép bạn chỉnh sửa php, html và mã khác mà không cần cài đặt nó trên máy tính cá nhân.

Bây giờ hãy nói về Khả năng soạn thảo văn bản Notepad ++.

Theo tôi, tôi sẽ không liệt kê tất cả các chức năng của trình soạn thảo văn bản này mà chỉ cho bạn biết về hầu hết các chức năng quan trọng hữu ích khi làm việc với mã php và html.

Một trong những tính năng tuyệt vời và cần thiết nhất của notepad++ là tính năng (cú pháp mã). Ví dụ: nếu bạn đặt con trỏ chuột vào thẻ mở

, khi đó thẻ đóng sẽ được đánh dấu đồng thời
.

Do đó, trình soạn thảo notepad++ sẽ cho phép bạn tránh lỗi khi chỉnh sửa mã hoặc sửa chúng.

Tất cả các thành phần mã ghép nối khác đều được đánh dấu bằng cách sử dụng cùng một nguyên tắc. Ví dụ: dấu ngoặc - () và.

Kiểu đánh dấu cú pháp được chọn tự động, phù hợp với loại mã đang được chỉnh sửa, bạn luôn có thể thay đổi bằng cách sử dụng tab “Style” (trong một số phiên bản, tab này được gọi là “Cú pháp”), nằm ở menu trên cùng .

Tôi muốn lưu ý rằng trình soạn thảo văn bản notepad++ hỗ trợ một số lượng lớn các loại mã (kiểu đánh dấu). Tôi sẽ không liệt kê tất cả chúng, tôi sẽ chỉ lưu ý những thứ phổ biến nhất: php, css, sql, xml, Java Script, C, C++, C#, Java và những thứ khác.

Các tính năng và khả năng của Notepad++ để chỉnh sửa HTML, PHP và các mã khác

Theo tôi, chức năng rất hữu ích tiếp theo của trình soạn thảo văn bản notepad++ là khả năng hoàn tác các thay đổi đã thực hiện trước đó đối với php, html và mã khác.

Hơn nữa, chức năng này được triển khai theo cách mà số bước lùi (hoàn tác hành động trước đó) không bị giới hạn. Nghĩa là, bạn có thể thử nghiệm mã bao nhiêu tùy thích mà không sợ mắc lỗi. Việc hoàn tác một hành động trong notepad++ được thực hiện bằng cách sử dụng các nút ở dạng mũi tên cong nằm trên thanh công cụ.

Đương nhiên, mọi hành động trong trình soạn thảo văn bản notepad++ đều có thể được thực hiện bằng phím nóng, có thể xem và chỉnh sửa trong tab menu “Tùy chọn”, chọn “Phím nóng…”

Một tính năng hữu ích khác mà tôi thường sử dụng là khả năng tự động hoàn thành văn bản đã nhập. Ví dụ: nếu bạn nhập một lệnh và không chắc chắn về cách viết đúng chính tả của từ đó thì chỉ cần nhấn tổ hợp phím Alt+Space, chính chương trình sẽ cung cấp cho bạn các tùy chọn để bạn lựa chọn.

Nhân tiện, chức năng này (hoàn thành từ tự động) có thể được cấu hình để hoàn toàn tự động, sau đó bạn sẽ không phải nhấn phím Alt+space mỗi lần và bản thân chương trình sẽ cung cấp các tùy chọn. Việc này được thực hiện trong tab “Tùy chọn”, mục “Cài đặt”, tab “Dự trữ/Tự động hoàn thành”, tại đây bạn cần kiểm tra dòng “Bật cho từng đầu vào”.

Ngoài ra, bạn có thể kiểm tra mục “Gợi ý khi nhập tham số chức năng”.

Nhiều chức năng hữu ích của trình soạn thảo văn bản notepad++ có thể được kích hoạt trong tab “TexFX”. Ví dụ: chức năng “Tự động đóng XHTML/XML” hiển thị trong ảnh chụp màn hình cho phép bạn tự động đóng các thẻ được ghép nối khi chúng được nhập, do đó ngăn ngừa lỗi phát sinh từ các thẻ ghép đôi không được đóng khi chỉnh sửa và viết mã.

Trình soạn thảo văn bản notepad++ hỗ trợ các tab. Nghĩa là, nếu bạn cần mở một số tài liệu, thì tất cả chúng sẽ không được mở riêng biệt, khởi chạy một số bản sao của chương trình mà sẽ mở trong một cửa sổ. Các tab có thể được quản lý bằng các cài đặt thích hợp (và theo mặc định), khi bạn khởi động chương trình, các tài liệu đã được chỉnh sửa trước khi đóng notepad++ sẽ được mở.

Chà, để kết thúc bài đăng của mình, tôi không thể không nhắc bạn về khả năng tuyệt vời để chuyển đổi và lưu văn bản ở dạng mã hóa UTF-8 mà không cần BOOM, điều này sẽ giúp bạn thoát khỏi hậu quả của việc thêm chữ ký này.

Ngoài ra, bạn có thể chỉ định notepad++ làm trình chỉnh sửa tệp văn bản trong chương trình FileZilla (đọc bài viết: “”) và chỉnh sửa từ xa các tệp WordPress, trực tiếp trên máy chủ của bạn.

"Trình soạn thảo HTML, CSS, PHP miễn phí: Notepad++"

“Bí mật làm việc trong Notepad++”

Đó là tất cả đối với tôi. Bạn thích bài viết như thế nào?

Trân trọng,

Chia sẻ với bạn bè của bạn:

Ghi chú:

Thảo luận: 27 bình luận

    Cảm ơn bài viết rõ ràng và chi tiết! Mặt khác, tôi vẫn không hiểu nên chọn mã hóa nào từ UTF-8 có hoặc không có BOM - BOM 😯

    Mọi thứ đều rõ ràng và dễ hiểu. Bài viết hay nhất về Notepad++

    Wow, nói thật đi, viết một bài thú vị như vậy có khó không?)

    Alexander Bobrin

    Vâng, có một số khó khăn nhỏ, tôi mất khoảng 4 giờ để viết bài :)

    “TexFX” Tôi không tìm thấy tab như vậy 😮 Gần đây tôi đã bắt đầu tích cực sử dụng trình chỉnh sửa này.

    4 tiếng...bạn chỉ là sao băng thôi 🙄 . Tôi có thể viết cả ngày. Tôi không thể viết nhanh và tôi không thể viết ngắn gọn.

    Và bài viết thực sự tốt. Tôi sẽ sử dụng nó như hướng dẫn.

    Điều này quá phức tạp đối với tôi, tôi cảm thấy mình như một cô gái tóc vàng 😯

    Bài báo tuyệt vời! Bây giờ thì rõ ràng krakozyabrs đến từ đâu. Chúng thường xuất hiện trong bảng quản trị khi tôi nhấp vào “Kích hoạt plugin”. Và khi tôi quay lại trang trước, chúng tự biến mất...

    Vâng, chương trình này thật tuyệt vời. Tôi đã sử dụng nó trong một thời gian dài và rất hài lòng. Không thể thiếu để chỉnh sửa các mẫu, plugin, v.v. Và ghi âm là tốt. Tôi chỉ mới biết về một số điểm gần đây và về những điểm khác chỉ sau khi đọc bài viết :)

    Bài viết hay. Biên tập viên xuất sắc, tôi đã sử dụng nó trong một thời gian dài và tôi nghĩ nó là loại tốt nhất.

    Bài viết thực sự rất hữu ích, cảm ơn Alexander.

    Tôi đã sử dụng notepad++ được một thời gian dài nhưng tôi đã học được rất nhiều điều mới.

    Và nếu trong file PHP có “;” Mình quên để ở cuối dòng hay còn mắc lỗi cú pháp nào nữa, notepad++ có báo lỗi không???

    và tôi không sử dụng máy tính xách tay mà sử dụng phpdesigner. Nó thuận tiện hơn

    Nhưng về phần mã hóa, tôi không biết cách thay đổi nó trong WritePipeDesigner. Tôi thực hiện việc này thông qua sổ ghi chú thông thường hoặc máy tính xách tay.

    Tôi đã sử dụng Notepad++ kể từ khi bắt đầu viết blog, đây là một chương trình tuyệt vời, tôi rất vui vì mã đã được đánh dấu, tôi giới thiệu nó cho mọi người!

    Vâng, chương trình này thật tuyệt vời. Tôi đã sử dụng nó trong một thời gian dài và rất hài lòng. Không thể thiếu để chỉnh sửa các mẫu, plugin, v.v. Và ghi âm là tốt. Tôi chỉ mới biết về một số điểm gần đây và về những điểm khác chỉ sau khi đọc bài báo

    Trình soạn thảo tuyệt vời nhất cho php, tôi chỉ sử dụng nó) Không có gì thừa, có tất cả các chức năng cơ bản cần thiết cho công việc)

Ngày tạo: 2012-05-07 07:11:41
Chỉnh sửa lần cuối: 2012-05-07 07:13:51

Tôi đã tìm kiếm rất lâu để tìm ra bài học nào sẽ đưa tài liệu này vào. Do đó, tôi quyết định mở rộng nó một chút và đưa nó vào một bài viết riêng.

Vì vậy, hôm nay chúng ta sẽ tìm hiểu cách thay đổi mã hóa trong hai trình soạn thảo văn bản: notepad tiêu chuẩn và Notepad++

Nhưng trước tiên, hãy nói đôi lời về tập tin văn bản.

Tệp văn bản

Có hai loại tệp văn bản: tệp văn bản thuần túy và tệp văn bản chứa thông tin định dạng (gọi là Rich Text Format).

Chúng tôi sẽ chỉ làm việc với các tệp văn bản đơn giản.

Mã hóa tập tin

Tất cả các tệp văn bản đều có một số loại mã hóa. Có hai cái chính: ANSI và Unicode. Mã hóa ANSI (và có rất nhiều mã hóa trong số đó) chỉ có thể mã hóa 256 ký tự. Nếu bạn có Windows được Nga hóa, thì notepad sẽ tạo tài liệu văn bản ở dạng mã hóa Windows-1251 - đây là một trong những mã hóa ANSI. Mã hóa ANSI nào được sử dụng tùy thuộc vào ngôn ngữ của hệ điều hành.

Unicode có thể chứa nhiều ký tự hơn - khoảng 65 nghìn ký tự, vì vậy tất cả các tập lệnh đều được mã hóa bằng Unicode. Tuy nhiên, có một số biến thể của Unicode. Unicode LE được sử dụng trên Windows, UTF-8 phổ biến trên Internet.

BOM (Byte Order Mark) - dấu thứ tự byte

Để phân biệt giữa các phiên bản Unicode khác nhau, một dấu đặc biệt có thể được đặt ở đầu tệp văn bản - cho biết văn bản của tệp được mã hóa ở phiên bản Unicode nào.

Nhãn bao gồm 2-4 byte.

Việc sử dụng BOM là tùy chọn và trong một số trường hợp là điều không mong muốn - đặc biệt khi nói đến các tệp mã nguồn.

Bây giờ hãy xem cách thay đổi mã hóa trong trình soạn thảo văn bản:

Thay đổi mã hóa tập tin trong notepad

Trong trình soạn thảo văn bản tiêu chuẩn, chỉ có thể thay đổi mã hóa khi lưu tệp.

Để thực hiện việc này, hãy sử dụng mục menu Tệp -> Lưu dưới dạng...

Trong hộp thoại mở ra, bạn có thể chọn mã hóa mong muốn ở phía dưới. Hơn nữa, chỉ có bốn lựa chọn:

ANSI là một trong các mã hóa ANSI (tùy thuộc vào ngôn ngữ hệ điều hành hiện tại), Unicode là phiên bản Unicode Little-Endian được sử dụng trong Windows. Unicode BE - Phiên bản Big-Endian của Unicode (được sử dụng trong (*NIX OS), UTF-8 - Unicode để lưu trữ tệp trên Internet.

Cách thay đổi mã hóa trong Notepad++

Phần kết luận

Tại sao chúng ta cần biết cách thay đổi bảng mã trong trình soạn thảo văn bản? Visual C++ IDE tự chọn mã hóa. Nếu bạn mở bất kỳ tệp mã nguồn nào (.cpp hoặc .h) trong trình soạn thảo văn bản đơn giản, bạn sẽ thấy mã hóa của tệp này là ANSI.

Trong các chương trình hợp ngữ, chúng ta cũng sẽ sử dụng ANSI - điều này được trình biên dịch yêu cầu. Nhưng khi chúng tôi phân tích các ngôn ngữ tập lệnh, các tệp nguồn có thể được lưu ở dạng UTF-8.

Tôi đang tìm một trình soạn thảo văn bản (đơn giản) có thể xử lý văn bản ở các bảng mã khác nhau trong cùng một tài liệu.

Tôi cần phát triển một số trang web có văn bản hỗn hợp tiếng Nhật và tiếng Anh và các trình soạn thảo mà tôi có (trên hệ thống Windows tiếng Anh) không thể hiển thị văn bản tiếng Nhật. File Jedit không hiển thị văn bản tôi nhập nhưng khi tôi xem file trên trình duyệt thì nó hiển thị chính xác. Gvim hiển thị tất cả văn bản tiếng Nhật trong trình chỉnh sửa dưới dạng dấu chấm hỏi và cả trong trình duyệt. Gvim nhập chữ kanji hoạt động (bạn nhập cách phát âm rồi nhấn phím cách để lấy chữ kanji), nhưng khi xác thực một chữ kanji, bạn muốn nó thay thế chữ kanji đó bằng dấu chấm hỏi. (1 dấu chấm hỏi cho mỗi chữ Hán).

Sau khi đọc emacs tôi đã cài đặt nó. Xem bên dưới.

Cám ơn tất cả mọi người cho lời khuyên. Nếu chưa có phông chữ Unicode, bạn nên tìm trên mạng hoặc mua một phông chữ. đây là hướng dẫn cài đặt font chữ trên hệ thống windows http://support.microsoft.com/kb/314960

jEdit Tôi đã thay đổi phông chữ của mình trong Jedit thành phông chữ UTF và bây giờ tiếng Nhật hiển thị ổn. gõ tiếng Nhật vẫn có vấn đề vì bạn không thể nhìn thấy mình đang gõ gì. (đổi phông chữ để chỉnh sửa tập tin vào Tiện ích -> Tùy chọn chung -> vùng văn bản chọn phông chữ Unicode và bạn sẽ có thể nhìn thấy các ký tự tiếng Nhật

GVim Tôi vẫn đang cố gắng tìm hiểu. cách thêm phông chữ vào gvim. Khi tôi biết cách thực hiện, tôi sẽ cập nhật phần này.

Emacs Emacs không hiển thị chính xác chữ kanji, chúng hiển thị dưới dạng ???, nhưng ít nhất tôi có thể thấy những gì tôi đang gõ bằng tiếng Nhật và chọn đúng từ.

vì vậy tại thời điểm này tôi nên nói rằng trong jEdit tôi có thể thấy văn bản tiếng Nhật, nhưng tôi không thể nhập văn bản tiếng Nhật. Gvim Tôi có thể nhập văn bản tiếng Nhật, nhưng bên trong vùng văn bản nó hiển thị là ??? và điều tương tự cũng xảy ra với Emacs. Thật không may, việc thêm phông chữ vào emacs và gvim không phải là một nhiệm vụ tầm thường. Tôi hiện đang sử dụng notepad với phông chữ MS Arial unicode và lưu dưới dạng tệp UTF-8 làm trình soạn thảo tiếng Nhật của mình. Không hoàn hảo, nhưng ít nhất nó hoạt động.

4

Đây là một yêu cầu khủng khiếp: "các mã hóa khác nhau trong cùng một tài liệu". Nếu ai đó tạo ra định dạng này, họ sẽ bị sa thải. Hãy truy cập Unicode và quên điều vô nghĩa này đi. Ngoài ra, tiếng Anh + tiếng Nhật được hỗ trợ mà không gặp vấn đề gì trên tất cả các trang mã tiếng Nhật nếu (vì lý do nào đó) bạn không thể sử dụng Unicode. - Mihai Nita 15 tháng 12 11 2011-12-15 12:06:08

0

@MihaiNita Đó cũng là phản ứng của tôi khi đọc câu đầu tiên, nhưng may mắn thay, "mã hóa khác nhau trong cùng một tài liệu" của OP dường như chỉ có nghĩa là "cả văn bản tiếng Nhật và tiếng Anh Nhật trong cùng một tài liệu" (cả hai đều được mã hóa Unicode trong UTF-8) Nhìn lại, có vẻ như vấn đề của OP chỉ đơn giản là không có phông chữ hệ thống tốt hiển thị các ký tự tiếng Nhật, điều này có lẽ đã được khắc phục. - ShreevatsaR ngày 19 tháng 8 16 2016-08-19 23:05:36