24 февраля 2010 г.

Обмен материалами: HTML и кодировки

Прочитал Предложение для блогов Delphi. Не то, чтобы я загорелся этой идеей, да и постов для обмена у меня нет. Однако....

У меня есть материал, вернее код, который отлично подходит под формат блога "Delphi в Интернет". Это - обёртка над MLang. Я взял код из рабочего проекта (это часть EurekaLog 7, кстати; я писал это, когда работал над правильной поддержкой unicode) и отправил его Владиславу. А он по нему написал статью: MLang в Delphi. Работа с кодировками Web-страниц. Сам я никакой статьи из этого делать не собирался - не формат моего блога, да и в web я ничего не понимаю. А вот для блога "Delphi в Интернет" материал в самый раз.

Краткое описание:

В общем, очень часто бывают задачи получения web-страничек. В результате обычно получают Ansi-строку, содержащую контент страницы. Однако, страничка эта может быть в куче разных кодировок. Win1251, UTF-8, KOI-8r и т.п. Как получить из этого читабельный текст? Ведь нельзя просто взять и использовать фиксированную кодовую страницу: а вдруг она потом изменится? Кроме того, она же зависит и от страницы: у каждого сайта своя кодировка.

В своё время, когда мне надо было решить эту проблему, я приемлемого решения не нашёл и пришлось писать своё (везде все используют фиксированный набор кодировок, что меня не устраивало совершенно). Поэтому я написал своё решение, использующее MLang - я так понимаю это то, чем пользуется IE. MLang.pas - заголовочник для работы с MLang. Готового я не нашёл. У джедаев нет. Нашёл какие-то поделки на RSDN, которые пришлось допилить напильником.

В общем, не буду дальше распинаться, читаем статью. Возможно, в дальнейшем в блоге Владислава вас ожидает ещё материал на связанную тему или практический пример использования.

4 комментария :

  1. Нет желания заслать сабж джедаям? Таки contribution от русского comunity для Delphi! Ну и реферрер с раскрученного ресурса!)

    ОтветитьУдалить
  2. Вообще, мысль конечно, но вообще, по идее, этот заголовочник должен быть авто-генерируемым по.... по... ну по чему-то :D Только я не нашёл по-чему. По MLang.dll он не хочет создаваться. Возможно, где-то есть tlb файл или что-то такое, но я его не нашёл. Короче, ламер я в COM, не могу судить :D

    У джедаев вроде авто-генерируемые заголовочники не выкладываются, т.к. их любой может создать по запросу.

    ОтветитьУдалить
  3. А я вот хотел из TIdHTTP взять ContentDisposition...
    Присваиваю строке String, смотрю в отладчике/memo - куча "обычных вопросиков".
    Присваиваю строке RawByteString, смотрю в отладчике/memo - куча "вопросиков в ромбике".
    Тыкался с разными функциями, и со всякими TEncoding - пока глухо, никак...

    ОтветитьУдалить

Можно использовать некоторые HTML-теги, например:

<b>Жирный</b>
<i>Курсив</i>
<a href="http://www.example.com/">Ссылка</a>

Вам необязательно регистрироваться для комментирования - для этого просто выберите из списка "Анонимный" (для анонимного комментария) или "Имя/URL" (для указания вашего имени и (опционально) ссылки на сайт). Все прочие варианты потребуют от вас входа в вашу учётку.

Пожалуйста, по возможности используйте "Имя/URL" вместо "Анонимный". URL можно просто не указывать.

Ваше сообщение может быть помечено как спам спам-фильтром - не волнуйтесь, оно появится после проверки администратором.

Примечание. Отправлять комментарии могут только участники этого блога.