TUMAN - это небольшая (менее 100Кб) консольная утилита для работы с архивами формата UNIX mailbox.
Самую новую версию можно скачать тут: http://stanislav.neva.pp.ru/tuman.zip
Программа была создана для облегчения работы в The Bat, в частности, с хранением архивов писем.
Не секрет, что письма, в особенности приходящие из почтовых конференций, обрастают по пути всякими
ненужными заголовками типа Received, X-заголовками и т. п. Кроме того, почтовые серверы типа yahoogroups.com
любят пихать в письма всякую рекламу. Возможно, это не имеет значения при хранении писем в бате,
но, создавая долговременный архив писем или же пересылая другу письма в формате unix, хочется на чём-то сэкономить.
Поэтому я и создал эту халявную утилитку. Юзайте на здоровье :)

Что же умеет TUMAN?

Рассмотрим основные способности программы.

Предположим, у нас в одной папке находится файл tuman.exe и архив писем unix.mbx

Напишем в командной строке

    tuman -i unix.mbx

Получим нечто вроде этого:

TUMAN ver. 0.4 (c) Stanislav V. Mikov <tuman@stanislav.neva.pp.ru>, 2004
TUMAN is the acronym for "TUMAN: Unix Mailbox Advanced Nibbler"
Download new versions at http://stanislav.neva.pp.ru/Downloadz.html

Processing archive unix.MBX....


Total letters found: 228

          Total size: 1132,10 Kb
        Headers size: 508,41 Kb
           Text size: 623,69 Kb

    Mean letter size: 4,97 Kb
   Mean headers size: 2,23 Kb
      Mean text size: 2,74 Kb

Туман вывел информацию об архиве: сколько в нём содержится писем, общий размер всех писем, всех заголовков и всех прочих частей писем (текс+аттачи), а также их средние значения по архиву.

Теперь, допустим, мы хотим выкинуть из всех писем необязательные заголовки типа X-ListServer, X-Original-Message-ID и пр., а также, так как мы не хотим следить за тем, где шлялись письма, хотим выкинуть заголовки Received.

Пишем так:

    tuman -i unix.mbx -o result.mbx -rrx

Вот результат:

TUMAN ver. 0.4 (c) Stanislav V. Mikov <tuman@stanislav.neva.pp.ru>, 2004
TUMAN is the acronym for "TUMAN: Unix Mailbox Advanced Nibbler"
Download new versions at http://stanislav.neva.pp.ru/Downloadz.html

Processing archive unix.MBX....


Total letters found: 228

          Total size: 1132,10 Kb
        Headers size: 508,41 Kb
           Text size: 623,69 Kb
Size of removed text: 109,71 Kb

    Mean letter size: 4,97 Kb
   Mean headers size: 2,23 Kb
      Mean text size: 2,74 Kb

      Compress ratio: 90,31%

Кроме того, в текущей папке появился файл result.mbx, который весит явно меньше оригинала.


Обратите внимание на строчку "size of removed text" - она указывает на объём "сэкономленного" текста. Последняя строка указывает на отношение объёма получившегося архива к объёму исходного.

А что будет, если выкинуть ещё что-нибудь? Легко.

    tuman -i unix.mbx -o result.mbx -rrxcly

TUMAN ver. 0.4 (c) Stanislav V. Mikov <tuman@stanislav.neva.pp.ru>, 2004
TUMAN is the acronym for "TUMAN: Unix Mailbox Advanced Nibbler"
Download new versions at http://stanislav.neva.pp.ru/Downloadz.html

Processing archive unix.MBX....


Total letters found: 228

          Total size: 1132,10 Kb
        Headers size: 508,41 Kb
           Text size: 623,69 Kb
Size of removed text: 433,07 Kb

    Mean letter size: 4,97 Kb
   Mean headers size: 2,23 Kb
      Mean text size: 2,74 Kb

      Compress ratio: 61,75%

Мы обрезали архивы "по самое не могу", зато какое сжатие! Но за счёт выкинутых References стала невозможной сортировка по тредам.

Теперь можно ещё обрезать части писем, стоящие после разделителя бата "-- ". Для этого используется опция -f:

    tuman -i unix.mbx -o result.mbx -rrxcly -f

TUMAN ver. 0.4 (c) Stanislav V. Mikov <tuman@stanislav.neva.pp.ru>, 2004
TUMAN is the acronym for "TUMAN: Unix Mailbox Advanced Nibbler"
Download new versions at http://stanislav.neva.pp.ru/Downloadz.html

Processing archive unix.MBX....


Total letters found: 228

          Total size: 1132,10 Kb
        Headers size: 508,41 Kb
           Text size: 623,69 Kb
Size of removed text: 788,12 Kb

    Mean letter size: 4,97 Kb
   Mean headers size: 2,23 Kb
      Mean text size: 2,74 Kb

      Compress ratio: 30,38%

Однако, сжали в 3 раза! Что поделать - это архив из почтовых конференций, где отношение полезной информации к технической сравнительно невелик. Кстати, если получившийся архив импортировать обратно в бат, можно заметить, что не все подписи обрезаны. Да, увы, не все настраивают должным образом свои почтовые программы. Поэтому ждите следующих версий Тумана!

Если вам нужно порезать архив на куски по 20 писем в каждом куске, дайте такую команду:

    tuman
-i unix.mbx -cn "c:\temp\" archive 20

В папке c:\temp\ вы получите файлы archive1, archive2 и т. д., содержащие каждый по 20 писем. Я советую всегда указывать название папки для экспорта в кавычках и с завершающим слешем. Если путь не существует, файлы создаваться не будут.


Для того, чтобы  порезать архив на куски примерно по 1,5 Мб каждый, сделайте так:


    tuman -i unix.mbx -cs "c:\temp\" archive 1500

Остальные команды вы можете узнать, набрав

    tuman -?

(чтобы сохранить вывод в файл, наберите
tuman -? > help.txt)

Вот вам напоследок команда:

    tuman.exe -i unix.MBX -lFd list.txt -fd "DD-MM-YY hh:nn:ss" -w 40

Эта команда выведет в файл list.txt список писем из unix.mbx, указав адрес отправителя и дату создания каждого письма.