Кодировка

Текст может быть закодирован несколькими способами. Большинство текстовых файлов (старых) используют кодировку называемой ANSI, которая имеет ограничение по количеству доступных символов, но часто бывает достаточной, чтобы отобразить весь текст. Тем не менее, кодировки Unicode позволяют более полное количество символов, что позволяет в одном файле содержать символы сразу нескольких языков одновременно, за счет увеличения размера файла. Notepad++ пытается автоматически определить кодировку файла при открытии, и в то же время позволяет изменять её. Чтобы изменить то, в какой кодировке отображать документ (без изменения самого текста), выберите один из пунктов меню Кодировки→Просмотр в кодировке .... Чтобы преобразовать текст в другую кодировку, выберите один из пунктов меню Кодировки→Преобразовать в ....

Может случиться так, что вы сохраняете файл в определенной кодировке, но после его открытия снова, обнаруживается, что он в другой кодировке. Это происходит, потому что кодировка определяется по содержимому файла и некоторое содержимое является правильным для различных кодировок. Это наиболее заметно, если файл сохранен без специальной метки BOM (Byte Order Mark) указывающей используемую кодировку.

Notepad++ предлагает следующие кодировки:

ANSI
Старая кодировка, маленький размер файла, но подвержен ошибкам за счет использования различных кодовых страниц
UTF-8
В кодировке Unicode большинство западных символов занимают один байт в файле, но для символов другого языка может занять больший размер, от 3 до 4 обычно. При сохранении 3 байта отводится метке BOM.
UTF-8 без BOM
Тоже что UTF-8, но без добавления метки BOM. Экономия трёх байт в итоге приводит к трудности обнаружения кодировки. Кроме того, именно эта кодировка используется для большинства веб-страниц.
UTF-16 Little Endian
Все символы размером два байта, пары следуют младшими байтами вперёд. При сохранении 2 байта отводится метке BOM.
UTF-16 Big Endian
Все символы размером два байта, пары следуют старшими байтами вперёд. При сохранении 2 байта отводится метке BOM.

Кроме того, начиная с версии 5.6, Notepad++ поддерживает изменение набора символов, который используется для отображения текста, именно так, как вы можете изменить его на большинстве веб-браузеров. Эти кодировки доступны во вложенном меню Кодировки→Кодировки ANSI (charset=...). Изначальная кодировка нового документа может быть любым видом Unicode, или любой из поддерживаемых форматов ANSI.

Notepad++ использует продвинутые методы анализа для оценки кодировки файла. Вы всегда можете выбрать правильную кодировку, если автоматический выбор оказался ошибочным. Когда файл сохраняется в сессию, текущая кодировка также сохраняется.