Упражнение doc какой это файл
Перейти к содержимому

Упражнение doc какой это файл

  • автор:

Типы файлов

В этом разделе объясняется, как создать новые типы файлов и связать приложение с типом файла и другими четко определенными типами файлов. Файлы с общим расширением общего имени файла (.doc, .html и т. д.) имеют один и тот же тип. Например, при создании нового текстового редактора можно использовать существующий тип файла .txt. В других случаях может потребоваться создать файл нового типа.

Эта тема организована следующим образом:

  • Типы общедоступных и частных файлов
  • Регистрация типа файла
    • Задание дополнительных подразделов и атрибутов расширения типа файла
    • Удаление сведений реестра во время удаления

    Дополнительные сведения можно найти в следующих разделах:

    • Выбор расширения типа файла
    • Определение атрибутов типа файла
    • Включение приложения в диалоговое окно «Открыть с помощью»
    • Исключение приложения из диалогового окна «Открыть с помощью» для несвязанных типов файлов

    Типы общедоступных и частных файлов

    Общедоступные типы файлов также известны как популярные или спорные типы, так как конкурирующие приложения могут быть связаны с этими типами файлов. Характеристики общедоступных типов файлов:

    • Как правило, они определяются органами по стандартам и/или продвигаются их определяющими организациями как форматы обмена.
    • Они часто обмениваются между компьютерами и пользователями для различных целей.
    • Они должны поддерживаться на разных платформах.
    • Приложения от нескольких поставщиков, скорее всего, будут обрабатывать их.

    Некоторые примеры типов файлов, которые считаются общедоступными, — это типы файлов изображений .png, .gif, .jpg и .bmp, а также типы звуковых файлов WAV, .mp3 и AU.

    В отличие от открытых типов файлов, частные или защищаемые типы файлов обычно имеют формат, который реализуется и понимается только одним приложением или поставщиком. В результате типы частных файлов обычно не подвержены конфликтам между приложениями. Некоторые типы файлов могут начинаться как частные типы файлов, но позже становятся общедоступными типами файлов.

    Windows не различает типы общедоступных и частных файлов. Различие имеет значение только при принятии решений о выборе регистрации типа файла.

    Регистрация типа файла

    Чтобы связать тип файла с существующим приложением, найдите приложение ProgID в реестре. Чтобы связать тип файла с новым приложением, определите ProgID для приложения. Сведения об определении нового Идентификатора ProgID см. в разделе Программные идентификаторы.

    Подразделы расширения имени файла имеют следующую общую форму: extension=ProgID. Подразделы расширения имени файла хранятся в поддереве HKEY_CLASSES_ROOT .

    Важно включить в реестр начальную точку (.) при создании подразделов типов файлов. Например, если требуется, чтобы тип файла с коротким расширением .myp и long .myp-file открывался с помощью приложения MyProgram, используйте следующий синтаксис:

    HKEY_CLASSES_ROOT .myp (Default) = ApplicationVendor.MyProgram .myp-file (Default) = ApplicationVendor.MyProgram ApplicationVendor.MyProgram (Default) = MyProgram Application 

    Как показано в предыдущем примере, если вы также регистрируете расширение короткого имени файла (MYP), необходимо также создать подраздел для расширения long (MYP-file). Дополнительные сведения см. в разделе Обработчики типов файлов.

    Задание дополнительных подразделов и атрибутов расширения типа файла

    Записи расширения типа файлов в реестре имеют несколько необязательных подразделов и атрибутов.

    Записи расширения типа файла, используемые сопоставлениями файлов, описаны в следующей таблице. Все значения относятся к типу REG_SZ .

    Параметр реестра Действие
    Значение по умолчанию Задайте для подраздела расширения значение по умолчанию progID, с которым он связан.
    Тип содержимого Задайте для параметра Content Type (Тип контента) тип контента MIME для типа файла.
    OpenWithList Не используйте. Этот подраздел содержит один или несколько подразделов приложений для приложений, которые отображаются в записи Открыть с помощью диалогового окна для типа файла и предназначены только для .exe приложений в операционных системах до Windows XP. Вместо этого используйте OpenWithProgIds.
    OpenWithProgIds Этот подраздел содержит список альтернативных идентификаторов ProgID для этого типа файлов. Программы для этих идентификаторов ProgID отображаются в меню Открыть с помощью и доступны в качестве приложений Магазина Windows по умолчанию для типа файлов. Всякий раз, когда приложение получает этот тип файла путем изменения значения по умолчанию, оно также должно добавить запись в этот список.
    PerceivedType Присвойте параметру PerceivedType значение PerceivedType, к которому принадлежит файл, если таковой имеется. Эта строка не используется версиями Windows, предшествующими Windows Vista. Дополнительные сведения см. в разделе Воспринимаемые типы и регистрация приложений.

    Общая форма подраздела расширения имени файла выглядит следующим образом. Все типы записей относятся к типу REG_SZ .

    HKEY_CLASSES_ROOT .ext (Default) = ProgID.ext.1 Content Type = MIME content type PerceivedType = PerceivedType OpenWithProgids ProgID2.ext.1 ProgID3.ext.1 ProgID.ext.1 shellnew 

    Ниже приведены важные рекомендации по поводу типов файлов.

    • Поддеревье HKEY_CLASSES_ROOT — это представление, сформированное путем объединения классов программного обеспечения HKEY_CURRENT_USER\иклассовпрограммного\обеспечения\ HKEY_LOCAL_MACHINE \
    • Как правило, HKEY_CLASSES_ROOT считывается из , но не записывается в . Дополнительные сведения см. в статье HKEY_CLASSES_ROOT .
    • Чтобы глобально зарегистрировать тип файла на определенном компьютере, создайте запись для этого типа файла в подразделе HKEY_LOCAL_MACHINE\Классов программного обеспечения\.
    • Чтобы сделать регистрацию типа файла видимой только для текущего пользователя, создайте запись для этого типа файла в подразделе HKEY_CURRENT_USER\Классов программного обеспечения\.
    • Приложение может предоставлять собственную реализацию команды, например open или play, как показано в следующем примере реестра.

    HKEY_CLASSES_ROOT Applications ApplicationName.exe shell verb 

    Подразделы реестра «Пути к приложениям » и «Приложения » используются для регистрации и управления поведением системы от имени приложений. Дополнительные сведения об этой функции см. в разделе Регистрация приложений.

    Удаление сведений реестра во время удаления

    При удалении приложения идентификаторы ProgID и большинство других сведений реестра, связанных с этим приложением, должны быть удалены в ходе удаления. Однако приложения, которые взяли на себя права владения типом файлов (задав значение по умолчанию подраздела HKEY_CLASSES_ROOT.extension \ типа файла в ProgID приложения), не должны пытаться удалить это значение при удалении. Если оставить данные в поле По умолчанию, это позволяет избежать трудностей при определении того, является ли другое приложение владельцем этого типа файла, и перезаписывать значение по умолчанию после установки исходного приложения. Windows учитывает значение по умолчанию, только если ProgID обнаружил зарегистрированный ProgID. Если progID не зарегистрирован, он игнорируется.

    Обратите внимание, что другие сведения о владельцах типов файлов хранятся в поддереве HKEY_CURRENT_USER , а также используются только при регистрации приложения, на которое оно ссылается. Таким образом, эти данные не нужно удалять при удалении приложения.

    В качестве примера ниже показано состояние реестра перед удалением приложения.

    HKEY_CLASSES_ROOT .mp3 (Default) = YourProgID YourProgID shell open command (Default) = yourapp.exe %1 

    Ниже показано состояние тех же записей реестра после удаления приложения.

    HKEY_CLASSES_ROOT .mp3 (Default) = YourProgID YourProgID subkey removed 

    Типы файлов, поддерживающие открытые метаданные

    В Windows 7 и более поздних версиях следующие типы файлов поддерживают открытые метаданные.

    Тип файла Расширения имен файлов
    Документы Office 2007 .docx, .xlsx, .pptx
    Документы Office 97–2003 .doc, .xls, .ppt
    Сохраненные поисковые запросы .search-ms
    Форматы на основе Windows Media (контейнер расширенного формата потоковой передачи (ASF) WMV, WMA
    MP4 (обработчик свойств) .mp4, .m4a, .m4v, .mp4v, .m4p, .m4b, .3gp, .3gpp, .3gp2, .mov

    название файлов и их расширения. информатика

    Все программы и данные хранятся в долговременной (внешней) памяти компьютера в виде файлов.

    Файл — это определенное количество информации (программа или данные) , имеющее имя и хранящееся в долговременной (внешней) памяти.

    Имя файла состоит из двух частей, разделенных точкой: собственно имя файла и расширение, определяющее его тип (программа, данные и т. д.) . Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании.

    bmp, gif, jpg, png, pds

    wav, mp3, midi, kar, ogg

    Код (текст) программы на языках программирования

    В различных операционных системах существуют различные форматы имен файлов. В операционной системе MS-DOS собственно имя файла должно содержать не более восьми букв латинского алфавита и цифр, а расширение состоит из трех латинских букв, например: proba.txt

    В операционной системе Windows имя файла может иметь до 255 символов, причем допускается использование русского алфавита, например:
    Единицы измерения информации. doc

    Остальные ответы
    и это уже при том вторая попытка!

    пуск- панель управления — параметры папок — вид — убрать галочку в «скрывать расширение»
    и в имени файлов после точки будет их расширение

    Все, что касается расширений файлов, что такое, как менять и так далее, доступно и подробно можете тут почитать:
    windows-ten.ru/what-is-the-file-extension

    Типы файлов

    Blackboard Learn по умолчанию поддерживает несколько типов файлов. Эти файлы открываются непосредственно в браузере или связанном приложении. Если Blackboard Learn не распознает тип файла, пользователи могут загрузить вложение и открыть его на своем компьютере.

    Программы, связанные с типами файлов

    Расширение Тип файла Программы, связанные с типом файла
    aam файлы мультимедиа; Подключаемый модуль Macromedia ® Authorware ®

    Файл AAM — обязательный файл для включения в ZIP-архив.

    AIFF — это формат аудио без сжатия. Обычно AIFF-файлы имеют большой размер.

    ASF-файлы могут содержать аудио, видео, изображения и текст.

    Исполняемые файлы — это приложения. Некоторые политики безопасности сети и брандмауэры могут запрещать пользователям скачивание исполняемых файлов.

    Ограничение допустимых типов файлов

    Вы можете ограничить типы файлов, которые пользователи могут загружать в Blackboard Learn.

    1. Откройте /usr/local/blackboard/config/internal/bb-file-filter-configuration.properties .
    2. В разделе # File types that cannot be uploaded добавьте типы файлов, которые необходимо исключить.
    3. Сохраните файл и запустите PushConfigUpdates.

    Начиная с выпуска Blackboard Learn от II квартала 2017 г., пользователи не могут отправлять следующие типы файлов из-за возможных угроз безопасности:

    Чтобы разрешить пользователям отправлять указанные типы файлов, обратитесь в службу поддержки Blackboard посредством веб-сайта Behind the Blackboard.

    Текст любой ценой: DOCX и ODT

    Недавно возникла задача получения чистого текста из различных форматов документооборота — будь-то документы Microsoft Word или PDF. Задача была выполнена даже с чуть более широким списком возможных входных данных. Итак, этой статьёй я открываю список публикаций о чтении текста из следующих типов файлов: DOC, DOCX, RTF, ODT и PDF — с помощью PHP без использования сторонних утилит.

    Для начала отвечу на вполне разумный вопрос: «Зачем это, собственно, надо?» Правильно, чистый текст, полученный из, к примеру, документа Word представляет собой достаточно перемешанную кашу. Но этого «бардака» вполне достаточно для построения, например, индекса для поиска по обширному хранилищу офисных документов.

    Другой вполне разумный вопрос: «Почему не использовать сторонние утилиты, например, antiword или xpdf, ну или в крайнем случае OLE под Windows?» Таковы уж были поставленные условия, да и OLE работает люто-бешено медленно, даже если задачу можно решить с помощью этой технологии.

    Сегодня, в качестве «затравки», я расскажу о достаточно простых для поставленной задачи форматах — это Office Open XML, больше известный как DOCX от Microsoft и OpenDocument Format, он же ODT от ODF Aliance.

    Для начала заглянем вовнутрь парочки файлов и увидим буквально следующее (сзади docx, спереди odt):

    Самое важное, что мы здесь видим, это первые два символа PK в начале данных. Это значит, что оба файла представляют собой переименованный в .docx/.odt zip-архив. Открываем, например, по Ctrl+PageDown в Total Commander и лицезреем вполне приемлемую структуру (слева odt, справа docx):

    Итак, нужные нам файлы с данными — это content.xml в ODT и word/document.xml в DOCX. Чтобы прочитать текстовые данные из них напишем несложный код:

    1. function odt2text ( $filename )
    2. return getTextFromZippedXML ( $filename , «content.xml» ) ;
    3. >
    4. function docx2text ( $filename )
    5. return getTextFromZippedXML ( $filename , «word/document.xml» ) ;
    6. >
    7. function getTextFromZippedXML ( $archiveFile , $contentFile )
    8. // Создаёт «реинкарнацию» zip-архива.
    9. $zip = new ZipArchive ;
    10. // И пытаемся открыть переданный zip-файл
    11. if ( $zip -> open ( $archiveFile ) )
    12. // В случае успеха ищем в архиве файл с данными
    13. if ( ( $index = $zip -> locateName ( $contentFile ) ) !== false )
    14. // Если находим, то читаем его в строку
    15. $content = $zip -> getFromIndex ( $index ) ;
    16. // Закрываем zip-архив, он нам больше не нужен
    17. $zip -> close ( ) ;
    18. // После этого подгружаем все entity и по возможности include’ы других файлов
    19. // Проглатываем ошибки и предупреждения
    20. $xml = DOMDocument :: loadXML ( $content , LIBXML_NOENT | LIBXML_XINCLUDE | LIBXML_NOERROR | LIBXML_NOWARNING ) ;
    21. // После чего возвращаем данные без XML-тегов форматирования
    22. return strip_tags ( $xml -> saveXML ( ) ) ;
    23. >
    24. $zip -> close ( ) ;
    25. >
    26. // Если что-то пошло не так, возвращаем пустую строку
    27. return «» ;
    28. >

    Всего каких-то 30 строк, и мы получаем текстовые данные из файла. Код работает под PHP 5.2+ и требует php_zip.dll под Windows или ключика —enable-zip под Linux. При отсутствии возможности использования ZipArchive (старая версия PHP или отсутствие библиотек) вполне может сгодиться библиотека PclZip, реализующая чтение zip-файлов без соответствующих средств в системе.

    Отмечу, что данный код является лишь заготовкой для решения задач чтения текста. После череды статей под лозунгом «Текст любой ценой», я постараюсь описать принципы и реализацию чтения форматированного текста.

    • msdn.microsoft.com/en-us/library/aa338205.aspx
    • www.i-rs.ru/Produkty/ODF-ISO-IEC-26300-2006/Dokumentaciya/Format-Open-Document-dlya-ofisnyh-prilozhenij-OpenDocument-v1.0.odt
    • Текст любой ценой: PDF
    • Текст любой ценой: RTF
    • Текст любой ценой: WCBFF и DOC

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *