post Category: Open source,Uncategorized post Comments (0) postАпрель 13, 2010

Многие системные администраторы в своей работе сталкиваются с задачей подсчета расходуемого трафика в своей локальной сети. Я расскажу, как справиться со сбором статистики и покажу, что, на самом деле, это несложная задача.

Данная статья была изначально опубликована в журнале «Системный администратор» (октябрь, 2005).

Многие системные администраторы в своей работе сталкиваются с задачей подсчета расходуемого трафика в своей локальной сети. Я расскажу, как справиться со сбором статистики и покажу, что, на самом деле, это несложная задача.

В данной статье рассмотрено решение задачи учета трафика, проходящего через шлюз локальной сети в интернет, с помощью ipcad. ipcad (Cisco IP accounting simulator) — это программа для учета трафика, которая может вести подсчет несколькими механизмами, например через интерфейсы BPF, libpcap и iptables ULOG. Материал предназначен для тех администраторов, в чьем ведении имеется малая или средняя локальная сеть. Все, что понадобится для работы — лишь сам ipcad, текстовый редактор для написания скриптов разбора статистики и огромное желание наконец решить задачу подсчета расходуемого трафика в локальной сети.

Данная статья охватывает процессы установки, настройки и запуска ipcad, а также рассматривает некоторые примеры написания скриптов разбора статистики.

Установка ipcad

Для начала необходимо скачать последнюю версию ipcad. На момент написания статьи таковой была 3.6.6. В самом процессе установки нет ничего нетривиального:

$ tar -xvzf ipcad-3.6.6.tar.gz
$ cd ipcad-3.6.6
$ ./configure
$ make
$ /bin/su -
# make install

В RPM-основанных дистрибутивах устанавливать лучше с помощью checkinstall (дабы следовать правилам пакетной системы).

Настройка ipcad

Из многочисленных способов ведения статистики самым простым является учет трафика, прошедшего через физические интерфейсы шлюза (в данной статье — два ethernet-интерфейса). Для конкретизации описания настроек взята локальная сеть с одной подсетью 192.168.0.0/24.

По умолчанию единственный конфигурационный файл ipcad находится в директории /usr/local/etc. Преобразованный под задачу учета трафика через два сетевых интерфейса eth0 и eth1 ipcad.conf выглядит следующим образом:

------------------------begin of ipcad.conf--------------------------
# /usr/local/etc/ipcad.conf
##################
# GLOBAL OPTIONS #
##################
# опция 'capture-ports' включает/отключает дополнительные поля
# в статистике, такие, как TCP- и UDP-порты, а также типы
# ICMP-пакетов. Однако включение данной опции увеличивает
# потребление памяти, снижает скорость подсчета трафика и,
# в ряде случаев, искажает вывод через RSH, поэтому она
# в данном примере отключена.
 

capture-ports disable;

# Размер буферов, используемых для передачи статистики ядром,
# по умолчанию равен 64 kb, чего вполне достаточно.
buffers = 64k

#####################
# INTERFACE OPTIONS #
#####################
# интерфейсы, на которых считается проходящий трафик.
# Рассматривается случай шлюза с двумя сетевыми интерфейсами:
# внутренним (локальная сеть) и внешним (интернет).

interface eth0;		# Считать трафик на Ethernet-интерфейсе...
interface eth1;		# ...и еще на одном.

# Разделять статистику по каждому IP-адресу для подсети 192.168.0.0/24.
# «aggregate 192.168.0.0/24» указывает ipcad диапазон адресов сети.
# «strip 32» означает, что в статистику необходимо заносить все 32 бита
# адреса, принадлежащего данному адресному диапазону.
aggregate 192.168.0.0/24 strip 32;

######################
# RSH SERVER OPTIONS #
######################
# Настройки rsh-сервера, с помощью которого будет просматриваться
# статистика.

rsh enable at 127.0.0.1;

# Правила ниже описывают политики доступа к статистике ipcad.
# root может полностью управлять (делать backup, просматривать
# и изменять таблицы подсчета). Все остальные могут лишь
# просматривать статистику.
rsh root@127.0.0.1 admin;
rsh root@127.0.0.1 backup;
rsh root@127.0.0.1;
rsh 127.0.0.1 view-only;

# “Время жизни” и тайм-аут IP пакета.
rsh ttl = 3;
rsh timeout = 30;

# опцией dumpfile задается путь к файлу, в который по умолчанию
# будут складываться данные  статистики
dumpfile = /var/log/ipcad/ipcad-curr.dump;

#################
# OTHER OPTIONS #
#################

pidfile = /var/run/ipcad.pid;

# Опция 'memory_limit задает количество памяти для хранения
# содержимого одного потока данных.
# Синтаксис следующий: memory_limit = <количество>[{k|m|e}] ;
# где 'k' -- килобайты, 'm' -- мегабайты, 'e' -- количество строк таблицы
# данных.
memory_limit = 10m;
--------------------------end of ipcad.conf--------------------------

Все остальные опции, задаваемые ipcad.conf, в нашем случае можно смело удалить (или, как минимум, закомментировать). Таким образом, они не будут задействованы вообще.

Примечание: директория /var/log/ipcad/ НЕ создается при установке ipcad, поэтому ее необходимо создать самостоятельно. Права на чтение, запись и просмотр содержимого директории с логами ipcad рекомендую дать лишь пользователю root. Всем остальным — запретить все, чтобы избежать даже просмотр простыми пользователями статистики расходуемого трафика в сети.

На этом процессы установки и настройки завершены, и можно переходить к запуску ipcad.

Запуск ipcad

Запускать ipcad имеет смысл таким образом, чтобы при загрузке он восстанавливал данные о статистике изdumpfile, уходил в фон, а при выключении сбрасывал все данные в тот же dumpfile. Команда для запуска выглядит следующим образом:

/usr/local/bin/ipcad -rds

где ключ ‘r’ импортирует данные из dumpfile, ‘d’ — «демонизирует» ipcad, ‘s’ — сбрасывает статистику в dumpfile при выключении ipcad.

Лучше всего разместить указанную команду в один из init-скриптов для запуска ipcad вместе с системой. В какой именно init-скрипт я не конкретизирую, т.к. это зависит от каждого дистрибутива. Например, в SuSE Linux для подобных целей служит скрипт /etc/init.d/boot.local, а в Red Hat — /etc/rc.d/rc.local.

Просмотр статистики

Для управления статистикой ipcad используется rsh, настройки которого [rsh] задаются в конфигурационном файлеipcad.conf (о чем говорится в пункте «Настройка ipcad»). Общий синтаксис команд для ipcad выглядит следующим образом: rsh host command

где ‘host’ — это хост, на котором ведется статистика, а ‘command’ — это сама команда. В рассматриваемом случае значением ‘host’ является localhost.

По команде: rsh localhost help — доступен полный список команд. А именно:

  • show ip accounting — показать статистику;
  • clear ip accounting — сбросить статистику до контрольной точки. Если контрольная точка не задана, то статистика сбрасывается в ноль;
  • show ip accounting checkpoint — показать статистику сохраненную в контрольных точках;
  • clear ip accounting checkpoint — сбросить все контрольные точки;
  • show ip cache flow — показать кэш NetFlow;
  • show interface <iface> — показать счетчик интерфейса <iface>;
  • dump [<path>] — сохранить текущую статистику в файл <path>. Если <path> не указывать, то статистика сохранится в dumpfile, указанный в конфигурационном файле ipcad.conf;
  • restore [<path>] — восстановить статистику;
  • import [<path>] — импортировать (добавить) статистику;
  • stat — показать текущее состояние работы ipcad;
  • show version — показать версию и uptime ipcad’а;
  • shutdown — завершить работу ipcad.

Для просмотра статистики достаточно: rsh localhost show ip accounting Однако таким образом на экран выведется информация обо всем трафике, прошедшем через шлюз. Т.е. в одной таблице будет статистика по всему входящему и исходящему трафику из локальной сети.

Получать нужные данные из вывода команды show ip accounting можно, например, с помощью самописных скриптов. Подобные скрипты пишутся «на коленке» за пять минут для каждой конкретной ситуации. Ниже приводится пример для показа статистики по одному указанному IP-адресу и подсчета суммарного трафика для этого IP:

------------------------Begin of traff.acc---------------------------
#!/bin/bash
# name of script: traff.acc
HOST=localhost
rsh $HOST dump
rsh $HOST show ip accounting | grep -E '192\.168\.0\.'$1'([^0-9]|$)'
echo
echo "Summary traffic of 192.168.0.$1 (kbytes):"
rsh $HOST show ip accounting | grep -E '192\.168\.0\.'$1'([^0-9]|$)' | awk '{s+=$4} END {print(s/1024)}'
--------------------------End of traff.acc---------------------------

Используется просто: ./traff.acc ip

где ip — это число от 1 до 254 (попросту, последний октет из IP-адреса). Результатом работы этого скрипта будет вывод на экран количества в мегабайтах входящего трафика для введенного IP-адреса.

Приведенный простейший скрипт будет выводить всю суммарную статистику по указанному IP адресу собранную с момента первого запуска ipcad и до текущего момента времени. А это не всегда удобно, поскольку наглядней иметь данные за какой-то конкретный промежуток времени (день/неделя/месяц). Мне достаточно вести статистику расходуемого трафика по месяцам. Схема такого учета выглядит следующим образом: в 23 ч. 59 мин. «последнего» числа каждого месяца делается dump статистики в файл, к названию которого целесообразно добавить значения года и текущего месяца. Уже через минуту, в 0 ч. 00 мин. 1-го числа следующего месяца, счетчик трафика сбрасывается командой clear ip accounting, статистика начинает вестись «с нуля». По достижении «последнего» дня месяца схема повторяется.

Для реализации этого механизма создан файл /etc/cron.d/ipcad с заданиями для cron’а:

------------------------Begin of /etc/cron.d/ipcad-------------------
* * * * * root rsh localhost dump >/dev/null
59 23 * * * root date "+\%Y\%m" > /var/log/ipcad/ipcad.date
0 0 1 * * root (rsh localhost dump /var/log/ipcad/ipcad-$(cat /var/log/ipcad/ipcad.date).dump && \
 rsh localhost clear ip accounting) >/dev/null 2>&1
--------------------------End of /etc/cron.d/ipcad-------------------

Первая задача из приведенного файла выполняет dump статистики каждую минуту. Делается это для защиты от непредусмотренных выключений и зависаний шлюза, на котором ведется учет проходящего трафика. Вторая строчка — это такой маленький «хак», который автор статьи вынужден был сделать, в связи с трудностью указания в расписании «последнего дня месяца» при настройке заданий cron’а. Суть в том, что каждый день в файл/var/log/ipcad/ipcad.date сохраняется текущий месяц и год (в формате YYYYMM). Эта же процедура, ведь, произойдет и в последний день месяца. Уже через минуту третье задание сделает dump статистики в файл, к названию которого прикрепится содержимое файла ipcad.date (т.е. год и _уже_ прошедший месяц в формате YYYYMM) и сбросит счетчик расходуемого трафика. В этот же день файл ipcad.date перезапишется новыми значениями текущих месяца и года. Не совсем красиво, но зато работает.

Теперь, когда есть данные о трафике по каждому месяцу, расположенные в разных dump-файлах, можно изменить скрипт, добавив к нему возможность просмотра общей и частной по каждому IP-адресу статистики израсходованного трафика за какой-то определенный месяц:

------------------------Begin of traff.acc.2-------------------------
#!/bin/bash
HOST=localhost
USERS=/etc/hosts
case $1 in
	M|m) echo "Summary LAN traffic of month $2 (Mbytes):"
	     rsh $HOST dump
	     awk '{s+=$4} END {print(s/1048576)}' < /var/log/ipcad/ipcad-$2.dump
	     exit 0;;
	U|u) grep -E '192\.168\.0\.'$3'([^0-9]|$)' $USERS | awk '{print($2)}'
	     USER=`grep -E '192\.168\.0\.'$3'([^0-9]|$)' $USERS | awk '{print($2)}'`
	     rsh $HOST dump
	     cat /var/log/ipcad/ipcad-$2.dump | grep -E '192\.168\.0\.'$3'([^0-9]|$)'
	     echo
	     echo "Summary traffic of $USER in $2 month (kbytes):"
	     cat /var/log/ipcad/ipcad-$2.dump | grep -E '192\.168\.0\.'$3'([^0-9]|$)' | awk '{s+=$4} END {print(s/1024)}'
	     exit 0;;
	*)   echo "Usage: "
	     echo "1) if only month stat:"
	     echo "   ./traff.acc.2 m "
	     echo "         — number of month"
	     echo "2) if user's stat for month:"
	     echo "   ./traff.acc.2 u  "
	     echo "	    — stat for that month"
	     echo "	    — last octet of user's IP address"
	     echo "note: for current month in flag  just type 'curr'"
	     exit 0;;
esac
--------------------------End of traff.acc.2-------------------------

В приведенном скрипте traff.acc.2 в переменной $USERS определяется файл, в котором есть соответствия имен пользователей и их IP-адресов (в данном примере — это /etc/hosts на шлюзе). Эта переменная необязательна и вводится в скрипт исключительно для наглядности просматриваемой статистики.

Использовать приведенный скрипт можно двумя способами:

  • ./traff.acc.2 m <month>, где семафор ‘m’ обозначает то, что на экран необходимо вывести общую статистику за указанный месяц;
  • ./traff.acc.2 u <month> <IP>, где семафор ‘u’ обозначает то, что на экран необходимо вывести статистику указанного пользователя за определенный месяц.

Флаг <month> — это шестизначный номер месяца в формате YYYYMM — такой формат хранения ежемесячных dump-файлов выбран в файле задач для cron’a (для вывода статистики за текущий месяц следует указать вместо номера месяца слово ‘curr’); флаг <IP> — это значение последнего октета IP-адреса пользователя, чью статистику надо просмотреть.

В заключение статьи хочу отметить, что вместо shell-скрипта можно написать скрипт на Perl и, добавив элементы навигации, прикрутить страницу с этим скриптом к httpd-серверу. Тогда статистика будет доступна для просмотра через браузер.

Sorry, no comments yet.

Write Your Comment

Comment Guidelines: Basic XHTML is allowed (a href, strong, em, code). All line breaks and paragraphs will be generated automatically.

You should have a name, right? 
Your email address, I promised I won't tell it to anyone. 
If you have a web site or blog, you can type the URL right here. 
This is where you type your comments. 
Remember my information for the next time I visit.