Первый пост темы
|
|
BIV
|
User
|
|
|
|
|
СОСО - Нужен ли новый формат сохранения страниц?
15/07/2004 18:52
|
|
|
С момента выхода первой версии программки "СОСО" прошло около 3-х месяцев. За это время мне написали достаточное число писем, что бы выявить 2 главные ошибки в работе программы: 1. Не отлаженный механизм перехвата диалога. 2. Проблемы по работе с утилитой "htm2chm".
Первая ошибка относительно легко исправляется, что я и сделаю в следующей версии. А вот со второй есть проблема. Т.к. "htm2chm" это отдельная программа, то взаимодействие с ней очень ограниченно фактически только запуск с параметрами и проверка на завершение работы(кстати, не стабильно работает). Т.е. отсутствие контроля - первая причина нестабильности. Решить её можно двумя путями.
Первый путь: Купить у автора "htm2chm" его собственный класс и скомпилировать страницу, но "СОСО" распространяется бесплатно и поддерживается на чистом энтузиазме, поэтому вариант с покупкой отпадает.
Второй путь: Проанализировав возможности формата CHM и прочитав письма, я пришел к вопросу, который хочу задать всем поклонникам Оперы: "А нужен ли именно CHM формат, может быть придумать новый ?"
Предлагаю следующее: Новый формат - по сути обычный ZIP-архив с дополнительным информационным файлом внутри и другим расширением.
Алгоритм работы: Порядок упаковки тот же, что и в случае с CHM, только выполнять его будет сама СОСО. А вот для просмотра потребуется программка, которая просто-напросто распакует файлы во временную папку и запустит браузер.
Сравним возможности CHM и гипотетического формата.
CHM: + Для просмотра не требуется спец. утилит т.к. они уже присутствуют в Windows. + Поддержка сжатия. - Опера "не понимает" данный формат, т.е. мы добиваемся сохранения страниц из Оперы, а просмотреть их в любимом браузере не можем. - Сложно найти бесплатные библиотеки для компиляции. +/- Создан фирмой "MicroSoft". +/- Сомнительна возможность просмотра файлов в альтернативных ОС, например, в Linux-e. Новый формат: + Поддержка нескольких уровней сжатия. + Опера и любой другой браузер смогут "просматривать" файлы этого формата. + Для распаковки (в случае отсутствия оригинальной утилиты) можно воспользоваться обычным архиватором, понимающим ZIP-архивы. + Найти бесплатные библиотеки для сжатия не составляет большого труда. + Распаковать будет возможно в любой ОС поддерживающей ZIP, т.е. почти в любой. - Для удобного просмотра (аналогично CHM) требуется оригинальная утилита и её регистрация в системе (т.е. связывание с конкретным расширением). - Т.к. файлы распаковываются во временный каталог, то в браузере в адресной строке будет прописан не путь к файлу нашего формата, а к страничке, которая лежит во временной папке.
Можно конечно сделать вывод по количеству плюсов, но мне не хотелось бы быть субъективным, поэтому пишите свои мнения и пожелания, свои за и против.
|
aga
|
Operaman
|
|
|
Зарегистр: 04/05/2004
|
Сообщений: 762
|
Из: россия, москва
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
15/06/2004 20:02
[Re: steap]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
а разьве опера может открывать mht? есть только программка для сохранения страниц из оперы в этот формат. получается та же история, что и с chm - невозможность открыть в любимом браузере.
|
AlexxO
|
Новичок
|
|
|
Зарегистр: 16/06/2004
|
Сообщений: 4
|
Из: Беларусь, Минская обл., Борисов
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
16/06/2004 12:20
[Re: aga]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
А разобрались уже как из dcache4.url достать имена файлов, где хранятся элементы кэша?
|
Stinger
|
Operaman
|
|
|
Зарегистр: 26/03/2004
|
Сообщений: 550
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
16/06/2004 17:18
[Re: AlexxO]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Пока Opera Software не создали(или не ипользовали существующий) формат сохранения страниц в единственный файл, вариант сохранения в ZIP-архивированный файл самый лучший. Тем более zip понимают все современные операционные системы, а в некоторые из них он даже встроен по умолчанию.
А реально ли написать плагин на Оперу, чтобы та понимала и открывала файлы этого формата?
|
kRuSHa
|
User
|
|
|
Зарегистр: 08/06/2004
|
Сообщений: 176
|
Из: Львів, Західна Україна, аматор ;-)
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
17/06/2004 06:29
[Re: Stinger]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
да, зиповать было бы неплохо.
думаю, плагин написать мона. хотя сам не умею ;-))
|
Kildor
|
Operaman
|
|
|
Зарегистр: 10/03/2004
|
Сообщений: 557
|
Из: Россия, Новосибирск
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
09/07/2004 18:42
[Re: kRuSHa]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Эх, есть такой классный формат 7z, который тоже бесплатен, опен сорс, а по сжатию часто обгоняет рар... но его не все понимают к сожалению..
|
fov
|
Новичок
|
|
|
Зарегистр: 02/03/2004
|
Сообщений: 39
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
10/07/2004 04:17
[Re: Kildor]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
А очень ли необходимо сжатие? Я вот тут покумекал и выходит следующее.
1. Если я сохраняю с помощью СОСО - значит сохраняю файл с джипегами. В противном случае можно воспользоваться обычным сохраненеием.
2. В документе хтмл + джипеги 90 процентов веса приходится на картинки, которые не сжимаются.
3. То есть, применяя сжатие, мы выигрываем в лучшем случае около 10 - 15 процентов дискового пространства, что несерьезно.
4. И теряем такую важную и необходимую вещь как поиск по тексту среди сохраненных документов.
Чесс слово, я бы отключил любое сжатие, и предпочел бы, чтобы все хранилось в прямом виде. А вы как считаете?
|
drronnie
|
Новичок
|
|
|
Зарегистр: 10/07/2004
|
Сообщений: 13
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
10/07/2004 19:45
[Re: fov]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Господин BIV, в первую очередь обращаюсь к Вам, но не только... Я сам тоже занимался этой проблемой... у меня сжималось в CHM при помощи HTML Help Workshop (хотя это не столь важно), а программа не резидентно сидела а запускалась из панели инструментов, получая через командную строку адрес файла странички... Но проблема немножко серьёзнее - с картинками... а после некоторых исследований я выяснил в чём геморрой... Значит так: Когда мы сохраняем страничку, которую открыли с диска - всё ОК, все ссылки на каринки есть... а вот когда мы пытаемся сохранить страничку только что загруженную из Интернета - возникает следующая проблема: страничка живёт в кеше, а в её коде ссылки на картинки выглядят как "http://www.kakoj-to_sajt.ru/kartiniki/kartinka_2.jpg", поэтому мы не знаем где её взять и остаётся только загрузить из Инета (что недопустимо при заданных условиях)... И ещё, когда Оперой сохраняем страничку с картинками бывает (и часто) что сохраняются не все картинки, а ещё им присваиваются дурацкие имена... (с кучей 0 и 1)
Теперь по поводу нового формата... Вы меня простите господа, но у него я вижу только один плюс, в сжатии. Всё! В остальном и CHM и планирующийся новый формат уступают страничке, которая созранена в обычном HTML... Только не в том дурацком виде (все файлы в одной папке) как сохраняет любимая Опера, а в том например, как сохраняет Mozilla или IE.
Теперь по поводу того, что сказал fov "С зипом идея хорошая. Все-таки сцепка из двух независимых программ - дело темное. Кстати, а почему именно зип? Нет ли открытых алгоритмов, более компактно жмущих текст/html? Так сказать, в порядке бреда...
Короче, я обеими руками за второй вариант."
Лучше всего жал (и жмёт) HA... был такой архиватор в светлые времена ДОСа, который лучше всего сжимает текст. Однако заметьте: во-первых ZIP самый распространённый (а универсальность наверно стоит на первом месте), во-вторых нам прийдётся сжимать кроме текста ещё и картинки, в-третьих по ZIP'у больше всего инфы и т.п. Так что если уж и новый формат - то жать в ЗИП! Я настаиваю!!!
По-моему вообще было бы лучше всего сделать программу, которая сохраняет из Оперы так же как IE
|
Mongoose
|
Moderator
|
|
|
Зарегистр: 21/05/2003
|
Сообщений: 1754
|
Из: Київ, Ненька Україна
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
11/07/2004 15:24
[Re: drronnie]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
В ответ на: Лучше всего жал (и жмёт) HA
Жал. Сейчас лучше жмёт RAR. Даже фидошная BOOK перешла с HA на RAR.
|
creatop
|
Новичок
|
|
|
Зарегистр: 06/07/2004
|
Сообщений: 7
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
12/07/2004 07:05
[Re: Mongoose]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Господа, не забывайте про TGZ. Уж ZIP то он точно в разы делает при сжатии текстов/картинокк. К тому же куча ebook-ов по сети ходит именно так заархивенных..
И еще совет - поройтесь на sourceforge.net - там дофига открытих проектов, в том числе и для работы с архивами..
|
drronnie
|
Новичок
|
|
|
Зарегистр: 10/07/2004
|
Сообщений: 13
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
12/07/2004 10:39
[Re: Mongoose]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Ну это не столь важно... господин fov говорит, что мол 90% - картинки, которые (увы) не жмуться... стоит ли сжимать? Плюс к этому - отсутствие поиска по тексту... отсюда следует, что от сжатия больше минусов нежели плюсов... По моему основная проблема состоит в том, чтоб привести документ в такой вид, как сохраняет IE или Mozilla (тобто "файл+папка с остальными файлами") А если уж и нужно сжимать - то это не проблема, потом можно приделать такую фичу... согласны все? Господин BIV?
2Mongoose: Помнится как то по мылу я спрашивал на счёт такой фичи, как "повесить два действия на одну кнопку в тулбаре"... Вот типа того проблема и становится... сохраняем оперой, а потом обрабатываем полученный файл...
Я вот именно сейчас работаю над этим преобразованием... Только из-за моих поверхностных знаний в синтаксисе HTML не всё так просто получается ... но кое что получается !!!
P.S. "... не всё так просто получается ... но кое что получается !!!" - похоже на слова песни из одного хорошего мультика "... Я безпороден - это минус, но благороден это плюс!!!!!"
|
drronnie
|
Новичок
|
|
|
Зарегистр: 10/07/2004
|
Сообщений: 13
|
|
|
|
Господа, попробуйте и оцените.... (прикреплённый файл)
Там в readme всё написано
Исправлено drronnie (16/07/2004 08:38)
|
m1kky
|
User
|
|
|
Зарегистр: 24/08/2003
|
Сообщений: 54
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
14/07/2004 13:47
[Re: drronnie]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
БЛИН! БЛИН! БЛИН! Зачем вы велосипед придумываете??? Нельзя ли лучше пытаться привести сохранённую страницу к виду IE, т.е.
<сохранённый_файл>.html [ПАПКА<сохранённый_файл>.files]
равзе так не проще??... надо всего-лишь все ссылки на странице перевести на эту папку и всё...
Оффлайн эксплореры как вообще локализую ссылки? также почти..
|
drronnie
|
Новичок
|
|
|
Зарегистр: 10/07/2004
|
Сообщений: 13
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
14/07/2004 14:30
[Re: m1kky]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
В ответ на: БЛИН! БЛИН! БЛИН! Зачем вы велосипед придумываете??? Нельзя ли лучше пытаться привести сохранённую страницу к виду IE, т.е.
<сохранённый_файл>.html [ПАПКА<сохранённый_файл>.files]
равзе так не проще??... надо всего-лишь все ссылки на странице перевести на эту папку и всё...
попробуй прикреплённый файл к моему сообщению перед вашим!
|
sgerasch
|
Новичок
|
|
|
Зарегистр: 15/07/2004
|
Сообщений: 3
|
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
15/07/2004 07:34
[Re: BIV]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Я конечно дико извиняюсь,но... Существует такая программа: Local Website Archive
Local Website Archive offers a fast and easy way to store websites from your browser or other online tools permanently for future reference.
Information on the web often vanishes quickly, sometimes before you even have a chance to make use of it. Let Local Website Archive store the information you're interes В кратце- Сохраняет html странички, может делать архивы страниц, встраивается в Оперу: Item, "Сохранить в АРХИВ" = Execute program,"C:\Program Files\Local Website Archive\wsarc_add.exe" Item, "Открыть АРХИВ" = Execute program,"C:\Program Files\Local Website Archive\wsarc.exe"
Проблемма только в регистрации, без регистрации сохраняет только 100 страниц. Кроме Оперы, поддерживает кучу браузеров. Экспортирует как ZIP и EXE. И еще куча полезностей.
|
steap
|
Новичок
|
|
|
Зарегистр: 08/06/2004
|
Сообщений: 10
|
Из: Россия, Новосибирск
|
|
Re: СОСО - Нужен ли новый формат сохранения страниц?
15/07/2004 18:52
[Re: sgerasch]
[post link]
|
Напомнить
Правка
|
Сообщить
Ответ
|
|
|
Нашел в Линуксе интересный формат для сжатия - "bz2". Сейчас тестирую. Сжал html + графика - всего 941 файл (3,7 мб (3 840 867 б)). Из всех файлов: html, htm, php - 182 файла, графика - 350 файлов и остальные - текстовые файлы. При сжатии zip'ом получилось 1,9 мб (2 022 318 б). При сжатии с помощью gz - 1,6 мб (1 716 563 б). bz2 - 1,5 мб (1 601 913 б). А, чуть не забыл... rar - 1,8 мб (1 915 818 б). Вот!
В справке про bz2 пишут: "bzip2 compresses files using the Burrows-Wheeler block sorting text compression algorithm, and Huffman coding. Compression is generally considerably better than that achieved by more conventional LZ77/LZ78-based compressors, and approaches the performance of the PPM family of statistical compressors."
gz: "Gzip reduces the size of the named files using Lempel-Ziv coding (LZ77). Whenever possible, each file is replaced by one with the extension .gz, while keeping the same ownership modes, access and modi- fication times. (The default extension is -gz for VMS, z for MSDOS, OS/2 FAT, Windows NT FAT and Atari.) If no files are specified, or if a file name is "-", the standard input is compressed to the standard output. Gzip will only attempt to compress regular files. In particu- lar, it will ignore symbolic links."
P.S. Судя по тому, что bzip входит в состав Linux Fedora Core 2, он является бесплатным. Вот его сайт: http://sources.redha....com/bzip2
|