Можно ли быть абсолютно уверенным, что в файле с расширением txt есть текст
Обновлено: 22.11.2024
Но не открывать такие файлы, как .doc, .pdf, .exe и т. д.
6 ответов 6
В целом: сказать невозможно.
Несмотря на то, что вы можете открыть файл и просмотреть часть содержимого, все эти эвристики иногда дают сбой (например, блокнот пытается это сделать, тщательно выбирая несколько символов, блокнот угадывает неправильно и отображает совершенно другое содержимое).< /p>
Если у вас есть конкретный сценарий, вместо того, чтобы открывать и обрабатывать что-либо, вы должны быть в состоянии сделать намного лучше.
Я думаю, вы могли бы просто проверить первые 1000 (произвольное число) символов и посмотреть, есть ли непечатаемые символы или все они являются ascii в определенном диапазоне. Если второе, предположим, что это текст?
Что бы вы ни делали, это будет догадкой.
ОБНОВЛЕНИЕ. В наши дни текстовый файл чаще всего имеет кодировку UTF-8 или аналогичную кодировку символов Unicode. Ищите новые ответы. Например, узнайте, как Notepad++ определяет, что файл является текстовым.
Многие приложения проверяют символы NUL, чтобы определить, является ли файл двоичным. Git является одним из примеров. См. мой полный ответ ниже.
Как уже отмечали другие, абсолютной уверенности не существует. Однако, чтобы определить, является ли файл двоичным (что, можно сказать, проще, чем определить, является ли он текстовым), некоторые реализации проверяют наличие последовательных символов NUL. Git, по-видимому, просто проверяет первые 8000 символов на наличие NUL и, если находит, обрабатывает файл как двоичный. Подробнее см. здесь.
Чтобы получить настоящий тип файла, необходимо проверить его заголовок, который не изменится даже при изменении расширения. Вы можете получить список заголовков здесь и использовать что-то вроде этого в своем коде:
Меня интересует ваша ссылка на "здесь", но она не работает. Вы знаете, что это был за URL или какой новый??
@MacGyver: Извините, неработающая ссылка находится вне моего контроля. Я наткнулся на это решение в чужом посте.
Этот подход ошибочен. Невозможно отличить файл BMP от файла, который начинается с символов "BM", что более чем вероятно.
С практической точки зрения это следует расширить, чтобы проверить больше, чем только первые два символа, чтобы определить «вероятность» того, что в файле отсутствует заголовок, и на самом деле это какой-то другой формат. Например, если вы читаете все байты файла, и ни в одном из них не установлен бит знака, скорее всего, это текст ASCII. Определить, действительно ли это текстовый файл UTF-8 без спецификации, гораздо сложнее (невозможно сделать идеально).
Тим Фишер имеет более чем 30-летний опыт работы в сфере технологий. Он пишет о технологиях более двух десятилетий и является вице-президентом и генеральным директором Lifewire.
В этой статье
Перейти к разделу
Текстовый файл – это файл, содержащий текст, но есть несколько разных способов понять это, поэтому важно знать, какой тип текстового документа у вас есть, прежде чем работать с программой, которая может его открыть или преобразовать.
Некоторые текстовые файлы имеют расширение .TXT и не содержат изображений. Другие могут содержать как изображения, так и текст, но по-прежнему называться текстовым файлом или даже сокращаться как «файл txt», что может сбивать с толку.
Типы текстовых файлов
В общем смысле под текстовым файлом понимается любой файл, который содержит только текст и не содержит изображений и других нетекстовых символов. Иногда они используют расширение файла TXT, но это не обязательно. Например, документ Word, представляющий собой сочинение, содержащее только текст, может иметь формат файла DOCX, но все же называться текстовым файлом.
Другой вид текстовых файлов – это файлы с обычным текстом. Это файл, который содержит нулевое форматирование (в отличие от файлов RTF), то есть ничего не выделено полужирным шрифтом, курсивом, подчеркнутым, окрашенным, с использованием специального шрифта и т. д. Несколько примеров форматов простого текстового файла включают файлы, оканчивающиеся на XML, REG, BAT, PLS, M3U, M3U8, SRT, IES, AIR, STP, XSPF, DIZ, SFM, THEME и TORRENT.
Конечно, файлы с расширением .TXT также являются текстовыми файлами и обычно используются для хранения вещей, которые можно легко открыть в любом текстовом редакторе или записать в них с помощью простого скрипта. Примеры могут включать в себя хранение пошаговых инструкций о том, как что-то использовать, место для хранения временной информации или журналы, созданные программой (хотя они обычно хранятся в файле LOG).
«Обычный текст» или файлы с открытым текстом отличаются от файлов «обычный текст» (с пробелом). Если шифрование хранилища файлов или шифрование передачи файлов не используется, можно сказать, что данные существуют в открытом тексте или передаются по открытому тексту.Это может применяться ко всему, что должно быть защищено, но не защищено, будь то электронная почта, сообщения, текстовые файлы, пароли и т. д., но обычно это используется в отношении криптографии.
Как открыть текстовый файл
Все текстовые редакторы должны иметь возможность открывать любой текстовый файл, особенно если не используется какое-либо специальное форматирование. Например, файлы TXT можно открыть с помощью встроенной программы «Блокнот» в Windows, щелкнув файл правой кнопкой мыши и выбрав «Редактировать». Аналогично для TextEdit на Mac.
Еще одна бесплатная программа, которая может открыть любой текстовый файл, — Notepad++. После установки вы можете щелкнуть файл правой кнопкой мыши и выбрать «Редактировать с помощью Notepad++».
Большинство веб-браузеров и мобильных устройств также могут открывать текстовые файлы. Однако, поскольку большинство из них не предназначены для загрузки текстовых файлов с использованием различных расширений, которые вы предполагаете использовать, вам может потребоваться сначала переименовать расширение файла в .TXT, если вы хотите использовать эти приложения для чтения файла.
К другим текстовым редакторам и средствам просмотра относятся Microsoft Word, TextPad, Notepad2, Geany и Microsoft WordPad.
Дополнительные текстовые редакторы для macOS включают BBEdit и TextMate. Пользователи Linux также могут попробовать открывающие/редакторы текста Leafpad, gedit и KWrite.
Открыть любой файл как текстовый документ
Здесь нужно понимать, что любой файл можно открыть как текстовый документ, даже если он не содержит читаемого текста. Это полезно делать, когда вы не уверены, в каком формате файл на самом деле находится, например, если в нем отсутствует расширение файла или вы думаете, что он был идентифицирован с неправильным расширением файла.
Например, вы можете открыть аудиофайл MP3 как текстовый файл, подключив его к текстовому редактору, например Notepad++. Вы не можете воспроизвести MP3 таким образом, но вы можете увидеть, из чего он состоит в текстовой форме, поскольку текстовый редактор может отображать данные только как текст.
В частности, для MP3 самая первая строка должна включать "ID3", чтобы указать, что это контейнер метаданных, в котором может храниться такая информация, как исполнитель, альбом, номер трека и т. д.
Другим примером является формат файла PDF. каждый файл начинается с текста «%PDF» в первой строке, даже если остальная часть документа совершенно нечитаема.
Как конвертировать текстовые файлы
Единственной реальной целью преобразования текстовых файлов является сохранение их в другом текстовом формате, таком как CSV, PDF, XML, HTML, XLSX и т. д. как правило, поддерживаются только основные форматы экспорта, такие как TXT, CSV и RTF.
Например, упомянутая выше программа Notepad++ способна сохранять в огромное количество форматов файлов, таких как HTML, TXT, NFO, PHP, PS, ASM, AU3, SH, BAT, SQL, TEX, VGS, CSS, CMD, REG, URL, HEX, VHD, PLIST, JAVA, XML и KML.
Другие программы, которые экспортируют в текстовый формат, вероятно, могут сохранять в нескольких различных форматах, обычно в TXT, RTF, CSV и XML. Поэтому, если вам нужно, чтобы файл из определенной программы был в новом текстовом формате, подумайте о том, чтобы вернуться к приложению, создавшему исходный текстовый файл, и экспортировать его в другое место.
Тем не менее, текст является текстом, пока он является обычным текстом, поэтому простое переименование файла, замена одного расширения на другое может быть всем, что вам нужно сделать, чтобы "преобразовать" файл.
См. наш список бесплатных программ для конвертации документов, чтобы узнать о некоторых дополнительных конвертерах файлов, которые работают с различными типами текстовых файлов.
Ваш файл все еще не открывается?
Вы видите перемешанный текст при открытии файла? Может быть, большая часть или все это совершенно нечитаемо. Наиболее вероятной причиной этого является то, что файл не является обычным текстом.
Как мы упоминали выше, вы можете открыть любой файл с помощью Notepad++, но, как и в примере с MP3, это не означает, что вы действительно можете использовать файл там. Если вы пробуете свой файл в текстовом редакторе, и он не отображается так, как вы думаете, переосмыслите, как он должен открываться; это, вероятно, не в формате файла, который можно объяснить в удобочитаемом тексте.
Если вы не знаете, как должен открываться ваш файл, рассмотрите возможность попробовать некоторые популярные программы, которые работают с широким спектром форматов. Например, хотя Notepad++ отлично подходит для просмотра текстовой версии файла, попробуйте перетащить файл в медиаплеер VLC, чтобы проверить, содержит ли он медиафайл видео- или звуковые данные.
Некоторые телефоны или планшеты Android имеют встроенные офисные приложения, которые могут открывать файлы TXT, а также другие типы документов и электронных таблиц. Если офисное приложение вашего устройства не может открыть текстовый файл, попробуйте сторонний текстовый редактор Android. Например, загрузите Text Editor из магазина Google Play и используйте его для открытия и чтения текстовых файлов.
В Windows щелкните правой кнопкой мыши любое свободное место на рабочем столе > Создать > Текстовый документ. На Mac откройте Finder и перейдите в папку, в которой вы хотите разместить TXT-файл, затем запустите Терминал и введите touch MyTextFile.txt.В любой системе вы также можете открыть приложение для обработки текстов, например Microsoft Word, создать документ, а затем сохранить его как файл обычного текста (.txt).
В Excel выберите вкладку «Данные» > «Из текста/CVS» > выберите текстовый файл > «Импорт». Затем выберите «С разделителями» > выберите разделитель > «Далее» > «Основные» > «Готово». Затем, чтобы убедиться, что ваши данные начинаются со строки 1, столбца A, выберите «Существующий рабочий лист» и введите в поле «Добавить» «=$A$1».
На ПК с ОС Windows откройте командную строку и перейдите к папке, текстовое содержимое которой вы хотите просмотреть. В командной строке введите dir, чтобы вывести список всех файлов в папке. Чтобы вывести это в текстовый файл, введите listmyfolder.txt в командную строку.
Вы здесь, потому что у вас есть файл с расширением .txt. Файлы с расширением .txt могут запускаться только определенными приложениями. Возможно, файлы .txt являются файлами данных, а не документами или мультимедиа, что означает, что они вообще не предназначены для просмотра.
Обычные текстовые документы, сохраненные в формате TXT, можно создавать, открывать и редактировать с помощью широкого спектра программ редактирования текста и обработки текстов, разработанных для систем Linux, компьютеров на базе Microsoft Windows и платформ Mac. Содержимое этих файлов .txt представляет собой неформатированный текст ASCII, который можно сохранить в виде документов .txt в файлах небольшого размера. Почти все смартфоны поставляются в комплекте с приложениями, обеспечивающими поддержку совместимости для доступа к содержимому этих TXT-файлов, а устройство Kindle от Amazon также можно использовать для открытия и просмотра содержимого, хранящегося в TXT-документе. Популярные приложения для редактирования текста Microsoft Windows, такие как Microsoft Notepad, можно использовать для создания файлов TXT, и эту программу можно даже использовать для сохранения этих неформатированных текстовых документов в форматах HTML и JS среди других. Приложение Apple TextEdit также поддерживает открытие, просмотр и изменение содержимого текстового документа в формате TXT, и эту программу также можно использовать для создания текстовых документов и сохранения их в формате с расширением .txt. Существует множество приложений, разработанных для различных дистрибутивов Linux, которые могут создавать, открывать и просматривать текстовое содержимое этих файлов .txt, и благодаря такой широкой поддержке кросс-совместимости пользователи разных платформ могут обмениваться своими TXT-документами, скорее всего, без каких-либо проблем или проблем.
Запустите файл .txt или любой другой файл на своем ПК, дважды щелкнув его. Если ваши ассоциации файлов настроены правильно, приложение, предназначенное для открытия вашего файла .txt, откроет его. Возможно, вам потребуется загрузить или приобрести нужное приложение. Также возможно, что на вашем компьютере установлено правильное приложение, но файлы .txt еще не связаны с ним. В этом случае, когда вы пытаетесь открыть файл .txt, вы можете сообщить Windows, какое приложение подходит для этого файла. С этого момента при открытии файла .txt будет открываться правильное приложение. Нажмите здесь, чтобы исправить ошибки сопоставления файлов .txt
Иногда я получаю такие вопросы, как "Я создал файл с именем xyz.php или xyz.html с помощью Блокнота, и после загрузки его на свой веб-сайт и тестирования в браузере я получаю сообщение об ошибке 404 "Файл не найден". Что делать? я делаю?" Другой вариант этого вопроса: «Я пытался сохранить свой файл как xyz.pl, но когда я загрузил его на свой веб-сайт, я могу найти только xyz.pl.txt. Как мне получить файл xyz.pl?» В этой краткой статье объясняется, как можно решить проблему такого типа.
Исключая очевидное: убедитесь, что вы загрузили в нужное место
Если у вас возникла ошибка "Файл не найден", прежде чем мы приступим к устранению проблем, созданных Блокнотом, важно сначала исключить возможность того, что вы загрузили файл в неправильный каталог.
Простое подключение к вашему веб-сайту через программу FTP и загрузка файла в каталог, к которому вы сначала подключились, вероятно, приведет к размещению файла в неправильном месте.
Веб-серверы настроены так, что они обслуживают файлы только из определенных местоположений. Например, они не отображают вашу электронную почту из ваших почтовых папок для всеобщего обозрения. Как правило, в вашей учетной записи веб-хостинга вы должны загружать свои файлы в каталог с именем «www» или «public_html». Узнайте у своего веб-хостинга, куда вам нужно загрузить файлы, чтобы они отображались правильно.
Если вы проверили и точно знаете, что не совершали эту ошибку, переходите к следующему разделу.
Как решить проблему, созданную Блокнотом
Другой возможной причиной ошибки является Блокнот. Блокнот, вплоть до текущей версии, имеет практику добавления расширения «.txt» к вашим файлам, даже если вы его не указываете. Поэтому, если вы дадите своему файлу имя «xyz.html», Блокнот изменит имя на «xyz.html.txt», не сообщая вам об этом.Эта проблема усугубляется политикой Windows Explorer, которая не сообщает вам полные имена ваших файлов. Следовательно, если вы используете проводник для проверки файла, он покажет только "xyz.html".
Если вы уже сохранили свой файл, лучший способ решить эту проблему — сначала заставить Проводник всегда показывать вам расширение файла, а затем изменить имя файла на правильное. В любом случае это хорошая практика, так как возможность всегда видеть полное имя файла, вероятно, повышает безопасность вашей системы — у вас будет меньше шансов быть обманутыми всеми этими мошенниками, которые просят вас щелкнуть файл, который выглядит как изображение, но на самом деле является программа.
В Windows откройте меню «Пуск», введите «Параметры папки» (без кавычек) и щелкните строку «Параметры папки», которая появляется в верхней части меню «Пуск». Щелкните вкладку «Вид» в появившемся диалоговом окне. Найдите параметр «Скрыть расширения файлов для известных типов файлов» и снимите флажок рядом с ним, чтобы отключить его. Затем нажмите кнопку «ОК» в нижней части диалогового окна. (Если ваша версия Windows не работает так, как я здесь описываю, или шаги слишком расплывчаты, см. более подробные инструкции в моем полном руководстве по этому вопросу.)
Теперь вы сможете увидеть свой файл как его истинное имя, будь то " xyz.php.txt " или " xyz.html.txt " или что-то еще. Теперь щелкните один раз по имени файла. Проводник теперь позволит вам изменить имя файла. Если это не так, выберите имя файла и нажмите клавишу F2 на клавиатуре. Удалите расширение «.txt», оставив имя файла «xyz.php» (без кавычек) или «xyz.html». Убедитесь, что в конце нет точек или пробелов, то есть убедитесь, что имя файла действительно " xyz.php ", а не " xyz.php " с точкой в конце или чем-то подобным.
Когда вы нажмете клавишу ENTER, Windows выдаст предупреждение об опасности изменения имен файлов. Разрешить изменение имени.
Хотя это и устраняет проблему, прочтите следующий раздел, чтобы узнать, как избежать повторных действий в будущем при каждом использовании Блокнота.
Как избежать проблем с автоматическим расширением «.txt» в Блокноте в будущем
Если вы хотите, чтобы Блокнот сохранял, скажем, "xyz.php" без расширения ".txt", сохраните его как "xyz.php", включая кавычки, в диалоговом окне "Сохранить как". Когда вы включите кавычки, Блокнот сохранит файл с именем xyz.php буквально, без добавления каких-либо дополнительных расширений.
В качестве альтернативы вы можете выбрать более качественный текстовый редактор. На странице текстовых редакторов Free Programmer есть множество бесплатных. Не пугайтесь немного «редактора программиста». Несмотря на громкое название, редакторы для программистов — это простые текстовые редакторы с дополнительными функциями, облегчающими работу с ним, чем с Блокнотом.
Эта статья защищена авторским правом. Пожалуйста, не воспроизводите и не распространяйте эту статью полностью или частично в любой форме.
Он появится на вашей странице как:
Авторское право © 2007-2020 Кристофер Хенг. Все права защищены.
thesitewizard™, thefreecountry™ и HowToHaven™ являются товарными знаками Кристофера Хенга.
Последнее обновление этой страницы состоялось 23 ноября 2020 года.
Когда я создаю новый документ, содержащий только обычный текст, Ubuntu не обязывает меня добавлять расширение .txt к его имени. Он действительно работает очень хорошо: gedit открывает его без проблем, прекрасно понимая, что это всего лишь текст.
С этого момента я нашел только два аргумента за добавление расширения: 1/ возможность взаимодействия с системами Windows и 2/ избежание путаницы с папками с одинаковыми именами. Тем не менее эти два аргумента меня совсем не убеждают. Как следствие, должен ли я сохранять рефлекс добавления расширения к файлам или нет?
6 ответов 6
Это полностью ваше собственное решение — не позволяйте никому выбирать за вас.
Если это «рефлекс», то нет вреда в сохранении ваших текущих привычек. С другой стороны, он выглядит чище без расширений файлов.
По моему мнению, основной случай использования расширения — это когда вы отправляете файлы по электронной почте пользователям Windows — хотя они все еще могут открывать их в Блокноте (с помощью «Файл»-> «Открыть с помощью»), они, вероятно, будут смущены, если вы оставите это расширение выключенным.
В системах на базе Linux не имеет значения, используете ли вы расширение .txt или нет. На самом деле нет специального «расширения файла», как в Windows — это просто часть имени. Типы MIME используются для определения типа файла.
Однако, если вы хотите поделиться файлом с людьми, которые все еще используют Windows, им придется вручную открывать текстовые файлы с помощью блокнота, если вы не используете расширение .txt.
Есть и другие соображения совместимости. По умолчанию Блокнот не будет правильно отображать новые строки, потому что он использует другое окончание строки для Linux и других Unix-подобных систем. Текстовый редактор правильно отображает текстовые файлы в формате Windows, но вам может потребоваться дважды нажать клавишу Backspace, чтобы удалить новую строку.
Используя текстовый редактор под названием Geany, вы можете преобразовать между типами окончания строки через меню «Документ» -> «Установить окончание строки». Это также возможно в текстовом редакторе по умолчанию (Gedit), но я не знаю, как это сделать.
Лично я бы не стал использовать расширение .txt или окончания строк Windows для повседневного использования, но я преобразовывал файлы, когда мне нужно было поделиться ими с пользователями Windows.
Читайте также: