Всё про браузер Opera
.: Форум сайта - operaman.ru :.

Разное >> Soft

Страниц в этой теме: 1 | 2 | 3 | (показать все)
Первый пост темы

BIV
User
СОСО - Нужен ли новый формат сохранения страниц? 15/07/2004 18:52
 


С момента выхода первой версии программки "СОСО" прошло около 3-х месяцев. За это время мне написали достаточное число писем, что бы выявить 2 главные ошибки в работе программы:
1. Не отлаженный механизм перехвата диалога.
2. Проблемы по работе с утилитой "htm2chm".

Первая ошибка относительно легко исправляется, что я и сделаю в следующей версии. А вот со второй есть проблема. Т.к. "htm2chm" это отдельная программа, то взаимодействие с ней очень ограниченно фактически только запуск с параметрами и проверка на завершение работы(кстати, не стабильно работает). Т.е. отсутствие контроля - первая причина нестабильности. Решить её можно двумя путями.

Первый путь:
Купить у автора "htm2chm" его собственный класс и скомпилировать страницу, но "СОСО" распространяется бесплатно и поддерживается на чистом энтузиазме, поэтому вариант с покупкой отпадает.

Второй путь:
Проанализировав возможности формата CHM и прочитав письма, я пришел к вопросу, который хочу задать всем поклонникам Оперы: "А нужен ли именно CHM формат, может быть придумать новый ?"

Предлагаю следующее:
Новый формат - по сути обычный ZIP-архив с дополнительным информационным файлом внутри и другим расширением.

Алгоритм работы:
Порядок упаковки тот же, что и в случае с CHM, только выполнять его будет сама СОСО. А вот для просмотра потребуется программка, которая просто-напросто распакует файлы во временную папку и запустит браузер.

Сравним возможности CHM и гипотетического формата.

CHM:
+ Для просмотра не требуется спец. утилит т.к. они уже присутствуют в Windows.
+ Поддержка сжатия.
- Опера "не понимает" данный формат, т.е. мы добиваемся сохранения страниц из Оперы, а просмотреть их в любимом браузере не можем.
- Сложно найти бесплатные библиотеки для компиляции.
+/- Создан фирмой "MicroSoft".
+/- Сомнительна возможность просмотра файлов в альтернативных ОС, например, в Linux-e.

Новый формат:
+ Поддержка нескольких уровней сжатия.
+ Опера и любой другой браузер смогут "просматривать" файлы этого формата.
+ Для распаковки (в случае отсутствия оригинальной утилиты) можно воспользоваться обычным архиватором, понимающим ZIP-архивы.
+ Найти бесплатные библиотеки для сжатия не составляет большого труда.
+ Распаковать будет возможно в любой ОС поддерживающей ZIP, т.е. почти в любой.
- Для удобного просмотра (аналогично CHM) требуется оригинальная утилита и её регистрация в системе (т.е. связывание с конкретным расширением).
- Т.к. файлы распаковываются во временный каталог, то в браузере в адресной строке будет прописан не путь к файлу нашего формата, а к страничке, которая лежит во временной папке.

Можно конечно сделать вывод по количеству плюсов, но мне не хотелось бы быть субъективным, поэтому пишите свои мнения и пожелания, свои за и против.


aga
Operaman
***

Зарегистр: 04/05/2004
Сообщений: 762
Из: россия, москва
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
15/06/2004 20:02   [Re: steap]   [post link]  

а разьве опера может открывать mht? есть только программка для сохранения страниц из оперы в этот формат. получается та же история, что и с chm - невозможность открыть в любимом браузере.

AlexxO
Новичок

Зарегистр: 16/06/2004
Сообщений: 4
Из: Беларусь, Минская обл., Борисов
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
16/06/2004 12:20   [Re: aga]   [post link]  

А разобрались уже как из dcache4.url достать имена файлов, где хранятся элементы кэша?

Stinger
Operaman
****

Зарегистр: 26/03/2004
Сообщений: 550
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
16/06/2004 17:18   [Re: AlexxO]   [post link]  

Пока Opera Software не создали(или не ипользовали существующий) формат сохранения страниц в единственный файл, вариант сохранения в ZIP-архивированный файл самый лучший. Тем более zip понимают все современные операционные системы, а в некоторые из них он даже встроен по умолчанию.

А реально ли написать плагин на Оперу, чтобы та понимала и открывала файлы этого формата?

kRuSHa
User

Зарегистр: 08/06/2004
Сообщений: 176
Из: Львів, Західна Україна, аматор ;-)
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
17/06/2004 06:29   [Re: Stinger]   [post link]  

да, зиповать было бы неплохо.

думаю, плагин написать мона. хотя сам не умею ;-))

Kildor
Operaman
***

Зарегистр: 10/03/2004
Сообщений: 557
Из: Россия, Новосибирск
Re: СОСО - Нужен ли новый формат сохранения страниц?  
09/07/2004 18:42   [Re: kRuSHa]   [post link]  

Эх, есть такой классный формат 7z, который тоже бесплатен, опен сорс, а по сжатию часто обгоняет рар...
но его не все понимают к сожалению..



fov
Новичок

Зарегистр: 02/03/2004
Сообщений: 39
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
10/07/2004 04:17   [Re: Kildor]   [post link]  

А очень ли необходимо сжатие? Я вот тут покумекал и выходит следующее.

1. Если я сохраняю с помощью СОСО - значит сохраняю файл с джипегами. В противном случае можно воспользоваться обычным сохраненеием.

2. В документе хтмл + джипеги 90 процентов веса приходится на картинки, которые не сжимаются.

3. То есть, применяя сжатие, мы выигрываем в лучшем случае около 10 - 15 процентов дискового пространства, что несерьезно.

4. И теряем такую важную и необходимую вещь как поиск по тексту среди сохраненных документов.

Чесс слово, я бы отключил любое сжатие, и предпочел бы, чтобы все хранилось в прямом виде. А вы как считаете?

drronnie
Новичок

Зарегистр: 10/07/2004
Сообщений: 13
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
10/07/2004 19:45   [Re: fov]   [post link]  

Господин BIV, в первую очередь обращаюсь к Вам, но не только...
Я сам тоже занимался этой проблемой... у меня сжималось в CHM при помощи HTML Help Workshop (хотя это не столь важно), а программа не резидентно сидела а запускалась из панели инструментов, получая через командную строку адрес файла странички... Но проблема немножко серьёзнее - с картинками... а после некоторых исследований я выяснил в чём геморрой...
Значит так: Когда мы сохраняем страничку, которую открыли с диска - всё ОК, все ссылки на каринки есть... а вот когда мы пытаемся сохранить страничку только что загруженную из Интернета - возникает следующая проблема: страничка живёт в кеше, а в её коде ссылки на картинки выглядят как "http://www.kakoj-to_sajt.ru/kartiniki/kartinka_2.jpg", поэтому мы не знаем где её взять и остаётся только загрузить из Инета (что недопустимо при заданных условиях)...
И ещё, когда Оперой сохраняем страничку с картинками бывает (и часто) что сохраняются не все картинки, а ещё им присваиваются дурацкие имена... (с кучей 0 и 1)

Теперь по поводу нового формата... Вы меня простите господа, но у него я вижу только один плюс, в сжатии. Всё! В остальном и CHM и планирующийся новый формат уступают страничке, которая созранена в обычном HTML... Только не в том дурацком виде (все файлы в одной папке) как сохраняет любимая Опера, а в том например, как сохраняет Mozilla или IE.

Теперь по поводу того, что сказал fov
"С зипом идея хорошая. Все-таки сцепка из двух независимых программ - дело темное. Кстати, а почему именно зип? Нет ли открытых алгоритмов, более компактно жмущих текст/html? Так сказать, в порядке бреда...

Короче, я обеими руками за второй вариант."

Лучше всего жал (и жмёт) HA... был такой архиватор в светлые времена ДОСа, который лучше всего сжимает текст. Однако заметьте: во-первых ZIP самый распространённый (а универсальность наверно стоит на первом месте), во-вторых нам прийдётся сжимать кроме текста ещё и картинки, в-третьих по ZIP'у больше всего инфы и т.п. Так что если уж и новый формат - то жать в ЗИП! Я настаиваю!!!

По-моему вообще было бы лучше всего сделать программу, которая сохраняет из Оперы так же как IE

Mongoose
Moderator
****

Зарегистр: 21/05/2003
Сообщений: 1754
Из: Київ, Ненька Україна
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
11/07/2004 15:24   [Re: drronnie]   [post link]  

В ответ на:
Лучше всего жал (и жмёт) HA
Жал. Сейчас лучше жмёт RAR. Даже фидошная BOOK перешла с HA на RAR.

creatop
Новичок

Зарегистр: 06/07/2004
Сообщений: 7
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
12/07/2004 07:05   [Re: Mongoose]   [post link]  

Господа, не забывайте про TGZ.
Уж ZIP то он точно в разы делает при сжатии текстов/картинокк.
К тому же куча ebook-ов по сети ходит именно так заархивенных..

И еще совет - поройтесь на sourceforge.net - там дофига открытих проектов, в том числе и для работы с архивами..

drronnie
Новичок

Зарегистр: 10/07/2004
Сообщений: 13
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
12/07/2004 10:39   [Re: Mongoose]   [post link]  

Ну это не столь важно... господин fov говорит, что мол 90% - картинки, которые (увы) не жмуться... стоит ли сжимать? Плюс к этому - отсутствие поиска по тексту... отсюда следует, что от сжатия больше минусов нежели плюсов...
По моему основная проблема состоит в том, чтоб привести документ в такой вид, как сохраняет IE или Mozilla (тобто "файл+папка с остальными файлами") А если уж и нужно сжимать - то это не проблема, потом можно приделать такую фичу... согласны все? Господин BIV?

2Mongoose: Помнится как то по мылу я спрашивал на счёт такой фичи, как "повесить два действия на одну кнопку в тулбаре"... Вот типа того проблема и становится... сохраняем оперой, а потом обрабатываем полученный файл...

Я вот именно сейчас работаю над этим преобразованием... Только из-за моих поверхностных знаний в синтаксисе HTML не всё так просто получается ... но кое что получается !!!

P.S. "... не всё так просто получается ... но кое что получается !!!" - похоже на слова песни из одного хорошего мультика "... Я безпороден - это минус, но благороден это плюс!!!!!"

drronnie
Новичок

Зарегистр: 10/07/2004
Сообщений: 13
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
13/07/2004 22:37   [Re: drronnie]   [post link]   Прикреплённые файлы (776 downloads)

Господа, попробуйте и оцените.... (прикреплённый файл)
Там в readme всё написано

Исправлено drronnie (16/07/2004 08:38)

m1kky
User
***

Зарегистр: 24/08/2003
Сообщений: 54
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
14/07/2004 13:47   [Re: drronnie]   [post link]  

БЛИН! БЛИН! БЛИН! Зачем вы велосипед придумываете??? Нельзя ли лучше пытаться привести сохранённую страницу к виду IE, т.е.

<сохранённый_файл>.html
[ПАПКА<сохранённый_файл>.files]

равзе так не проще??... надо всего-лишь все ссылки на странице перевести на эту папку и всё...

Оффлайн эксплореры как вообще локализую ссылки? также почти..

drronnie
Новичок

Зарегистр: 10/07/2004
Сообщений: 13
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
14/07/2004 14:30   [Re: m1kky]   [post link]  

В ответ на:
БЛИН! БЛИН! БЛИН! Зачем вы велосипед придумываете??? Нельзя ли лучше пытаться привести сохранённую страницу к виду IE, т.е.

<сохранённый_файл>.html
[ПАПКА<сохранённый_файл>.files]

равзе так не проще??... надо всего-лишь все ссылки на странице перевести на эту папку и всё...

попробуй прикреплённый файл к моему сообщению перед вашим!

sgerasch
Новичок

Зарегистр: 15/07/2004
Сообщений: 3
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
15/07/2004 07:34   [Re: BIV]   [post link]  

Я конечно дико извиняюсь,но...
Существует такая программа:
Local Website Archive

Local Website Archive offers a fast and easy way to store websites from your browser or other online tools permanently for future reference.

Information on the web often vanishes quickly, sometimes before you even have a chance to make use of it. Let Local Website Archive store the information you're interes
В кратце-
Сохраняет html странички, может делать архивы страниц, встраивается в Оперу:
Item, "Сохранить в АРХИВ" = Execute program,"C:\Program Files\Local Website Archive\wsarc_add.exe"
Item, "Открыть АРХИВ" = Execute program,"C:\Program Files\Local Website Archive\wsarc.exe"

Проблемма только в регистрации, без регистрации сохраняет только 100 страниц.
Кроме Оперы, поддерживает кучу браузеров.
Экспортирует как ZIP и EXE.
И еще куча полезностей.


steap
Новичок

Зарегистр: 08/06/2004
Сообщений: 10
Из: Россия, Новосибирск
Re: СОСО - Нужен ли новый формат сохранения страниц? new 
15/07/2004 18:52   [Re: sgerasch]   [post link]  

Нашел в Линуксе интересный формат для сжатия - "bz2". Сейчас тестирую. Сжал html + графика - всего 941 файл (3,7 мб (3 840 867 б)). Из всех файлов: html, htm, php - 182 файла, графика - 350 файлов и остальные - текстовые файлы. При сжатии zip'ом получилось 1,9 мб (2 022 318 б). При сжатии с помощью gz - 1,6 мб (1 716 563 б). bz2 - 1,5 мб (1 601 913 б). А, чуть не забыл... rar - 1,8 мб (1 915 818 б). Вот!

В справке про bz2 пишут:
"bzip2 compresses files using the Burrows-Wheeler block sorting text
compression algorithm, and Huffman coding. Compression is generally
considerably better than that achieved by more conventional
LZ77/LZ78-based compressors, and approaches the performance of the PPM
family of statistical compressors."

gz:
"Gzip reduces the size of the named files using Lempel-Ziv coding
(LZ77). Whenever possible, each file is replaced by one with the
extension .gz, while keeping the same ownership modes, access and modi-
fication times. (The default extension is -gz for VMS, z for MSDOS,
OS/2 FAT, Windows NT FAT and Atari.) If no files are specified, or if
a file name is "-", the standard input is compressed to the standard
output. Gzip will only attempt to compress regular files. In particu-
lar, it will ignore symbolic links."

P.S. Судя по тому, что bzip входит в состав Linux Fedora Core 2, он является бесплатным. Вот его сайт: http://sources.redha....com/bzip2

Страниц в этой теме: 1 | 2 | 3 | (показать все)  

Разное >> Soft

Дополнительные сведения
0 зарег. и 11 анонимные пользователи просматривают этот форум.

Модератор:  netman, van_grieg, Angolier, Pechkin 

Распечатать тему

Разрешения
      Вы не можете создавать новые темы
      Вы не можете отвечать в темах
      HTML запрещен
      UBBCode разрешен

Рейтинг:
Тема просмотрена: 39053

Оценить эту тему
Быстрый поиск
Перейти на



  
Отправить email администрации operaman.ru - Home

© 2000-2002. Николай Ковальчук - All rights reserved
Rambler's Top100