Изучаем Linux, 101: Управление файлами и директориями

Изучение основ работы с файлами и директориями Linux

Наверное, вы знаете, что работа Linux основана на операциях с файлами, поэтому для освоения этой операционной системы необходимо уметь выполнять такие функции управления файлами и директориями, таких как поиск, просмотр, перемещение, копирование и архивирование. Вы можете использовать этот материал для подготовки к экзамену LPI® 101 программы сертификации на администратора Linux начального уровня или просто для общего развития.

Развить навыки по этой теме

Этот материал — часть knowledge path для развития ваших навыков. Смотри Основы системного администрирования Linux: работа с консолью

Краткий обзор

Из этой статьи вы узнаете об основных командах Linux для управления файлами и директориями. Вы научитесь:

  • Просматривать содержимое директорий.
  • Копировать, перемещать и удалять файлы и директории.
  • Рекурсивно управлять несколькими файлами и директориями.
  • Использовать метасимволы для управления файлами.
  • Использовать команду find для поиска и выполнения действий с файлами на основе их типа, размера или метки времени.
  • Сжимать и распаковывать файлы при помощи команд gzip и bzip2.
  • Архивировать файлы при помощи команд tar, cpio и dd.

Об этой серии

Эта серия статей поможет вам освоить задачи администрирования операционной системы Linux. Вы также можете использовать материал этих статей для подготовки к экзаменам первого уровня сертификации профессионального института Linux (LPIC-1).

Чтобы посмотреть описания статей этой серии и получить ссылки на них, обратитесь к нашему перечню материалов для подготовки к экзаменам LPIC-1. Этот перечень постоянно дополняется новыми статьями по мере их готовности и содержит самые последние (по состоянию на апрель 2009 года) цели экзаменов сертификации LPIC-1. Если какая-либо статья отсутствует в перечне, можно найти ее более раннюю версию, соответствующую предыдущим целям LPIC-1 (до апреля 2009 года), обратившись к нашим руководствам для подготовки к экзаменам института Linux Professional Institute.

Эта статья поможет вам подготовиться к сдаче экзамена LPI 101 на администратора начального уровня (LPIC-1) и содержит материалы цели 103.3 темы 103. Цель имеет вес 4.

Необходимые условия

Чтобы извлечь наибольшую пользу из наших статей, необходимо обладать базовыми знаниями о Linux и иметь работоспособный компьютер с Linux, на котором можно будет выполнять все встречающиеся команды. Иногда различные версии программ выводят результаты по-разному, поэтому содержимое листингов и рисунков может отличаться от того, что вы увидите на вашем компьютере.


Просмотр директорий

Как связаться с Яном

Ян – один из наших наиболее популярных и плодовитых авторов. Ознакомьтесь со всеми статьями Яна (EN), опубликованными на сайте developerWorks. Вы можете найти контактные данные в профиле Яна и связаться с ним, а также с другими авторами и участниками ресурса My developerWorks.

В Linux и UNIX® все файлы хранятся в виде дерева файловой системы с корневой директорией /. К этому дереву можно добавлять или удалять дополнительные ветви, монтируя или демонтируя их соответственно. Эти операции рассматривается в другой статье этой серии – "Монтирование и демонтаж файловых систем" (см. перечень материалов для подготовки к экзаменам LPIC-1).

Просмотр содержимого директории

При изучении команд в этой статье мы будем использовать файлы, которые были созданы в предыдущей статье этой серии "Изучаем Linux 101: текстовые потоки и фильтры". Если вы выполняли все упражнения данной статьи, то в вашей домашней директории должна присутствовать директория lpi103-2. Если такой директории у вас нет, то можете использовать любую другую директорию.

Имена файлов и директорий могут быть либо абсолютными (это означает, что они начинаются с /), либо относительными (не начинаются с /) по отношению к текущей рабочей директории. Абсолютный путь к файлу или директории состоит из символа /, за которым (необязательно) следуют одно или несколько имен директорий, разделенных дополнительными символами /, и, наконец, имя конечной директории.

Если вы знаете имя файла или директории относительно текущей рабочей директории, то вы можете просто объединить абсолютное имя рабочей директории, символ / и относительное имя. Например, директория lpi103-2 из предыдущей статьи была создана в моей домашней директории, /home/ian, поэтому ее полный, или абсолютный путь – это /home/ian/lpi103-2.

Имя текущей рабочей директории можно узнать при помощи команды pwd. Также это имя обычно содержится в переменной окружения PWD. В листинге 1 приведен пример использования команды pwd, а также показаны три различных способа использования команды ls для вывода списка файлов этой директории.

Листинг 1. Просмотр содержимого директории
[ian@echidna lpi103-2]$ pwd
/home/ian/lpi103-2
[ian@echidna lpi103-2]$ echo "$PWD"
/home/ian/lpi103-2
[ian@echidna lpi103-2]$ ls
sedtab  text1  text2  text3  text4  text5  text6  xaa  xab  yaa  yab
[ian@echidna lpi103-2]$ ls "$PWD"
sedtab  text1  text2  text3  text4  text5  text6  xaa  xab  yaa  yab
[ian@echidna lpi103-2]$ ls /home/ian/lpi103-2
sedtab  text1  text2  text3  text4  text5  text6  xaa  xab  yaa  yab

Как вы видите, для просмотра содержимого директории команде ls можно передать как ее относительное, так и абсолютное имя.

Вывод детальной информации

Файлы и директории располагаются на устройстве хранения в виде набора блоков. Информация о файле (такая, как владелец файла, время последнего обращения к файлу, размер файла, права на чтение или запись, является ли элемент файлом или директорией) хранится в индексном дескрипторе inode. Номер inode, известный также как порядковый номер файла, является уникальным в пределах отдельной файловой системы. Для вывода некоторых сведений, хранящихся в inode, можно использовать опцию -l (или --format=long).

По умолчанию команда ls не отображает специальные файлы, имена которых начинаются с точки (.). Каждая директория, за исключением корневой, имеет, как минимум, две специальных записи: сама директория (.) и родительская директория (..). Корневая директория не имеет родительской директории.

В листинге 2 приведен пример использования опций -l и -a для подробного вывода содержимого директории ( включая элементы . и ..).

Листинг 2. Подробный просмотр содержимого директории
[ian@echidna lpi103-2]$ ls -al
total 52
drwxrwxr-x.  2 ian ian 4096 2009-08-11 21:21 .
drwx------. 35 ian ian 4096 2009-08-12 10:55 ..
-rw-rw-r--.  1 ian ian    8 2009-08-11 21:17 sedtab
-rw-rw-r--.  1 ian ian   24 2009-08-11 14:02 text1
-rw-rw-r--.  1 ian ian   25 2009-08-11 14:27 text2
-rw-rw-r--.  1 ian ian   63 2009-08-11 15:41 text3
-rw-rw-r--.  1 ian ian   26 2009-08-11 15:42 text4
-rw-rw-r--.  1 ian ian   24 2009-08-11 18:47 text5
-rw-rw-r--.  1 ian ian   98 2009-08-11 21:21 text6
-rw-rw-r--.  1 ian ian   15 2009-08-11 14:41 xaa
-rw-rw-r--.  1 ian ian    9 2009-08-11 14:41 xab
-rw-rw-r--.  1 ian ian   17 2009-08-11 14:41 yaa
-rw-rw-r--.  1 ian ian    8 2009-08-11 14:41 yab

В первой строке листинга 2 мы видим общее количество дисковых блоков (52), занимаемых выведенными на экран файлами. Остальные строки содержат информацию о содержимом директории.

  • Первое поле (в нашем случае, drwxrwxr-x или -rw-rw-r--) говорит нам о том, является ли запись директорией (d) или обычным файлом (-). Также вы можете встретить символические ссылки (|) или другие обозначения некоторых специальных файлов (например, файлы в файловой системе /dev). Более подробно о символических ссылках рассказывается в другой статье этой серии "Работа с жесткими и символическими ссылками" (см. перечень материалов для подготовки к экзаменам LPIC-1). После поля с типом следует три набора разрешений (таких как rwx или r--): для владельца файла, для членов группы владельца и для всех остальных пользователей. Три значения определяют, имеет ли владелец, группа или все пользователи, соответственно, разрешения на чтение (r), запись (w) или выполнение (x). Другие атрибуты, такие как setuid, будут рассмотрены в другой статье этой серии "Управление разрешениями и правами владения файлов" (см. перечень материалов для подготовки к экзаменам LPIC-1).
  • Следующее поле содержит номер, который говорит нам о количестве жестких ссылок на файл. Как уже говорилось, индексный дескриптор inode содержит информацию о файле. Запись о хранящемся в директории файле содержит жесткую ссылку (или указатель) на inode этого файла, следовательно, каждая запись должна иметь, по крайней мере, одну жесткую ссылку. Записи директорий имеют одну дополнительную ссылку для записи ., и по одной ссылке для каждой поддиректории. Таким образом, из листинга 2 видно, что моя домашняя директория, обозначенная как .., имеет несколько поддиректорий, поскольку содержит 35 жестких ссылок.
  • Следующие два поля содержат имя владельца файла и имя основной группы, в которую он входит. В некоторых дистрибутивах Linux (например, Red Hat или Fedora) по умолчанию для каждого пользователя создается отдельная группа. В других системах все пользователи могут входить в одну или несколько групп.
  • Следующее поле содержит размер файла в байтах.
  • Предпоследнее поле содержит время модификации файла.
  • И, наконец, последнее поле содержит имя файла или директории.

Опция -i команды ls отобразит номера индексных дескрипторов inode. Мы вернемся к рассмотрению индексных дескрипторов далее в этой статье, а также в статье "Работа с жесткими и символическими ссылками" (см. перечень материалов для подготовки к экзаменам LPIC-1).

Информация о нескольких файлах

Вы можете передать команде ls несколько параметров, каждый из которых будет являться либо именем файла, либо именем директории. Если параметр является именем директории, то вместо информации об этой директории команда ls покажет ее содержимое. В нашем случае предположим, что мы хотим получить информацию о самой директории lpi103-2. Команда ls -l ../lpi103-2 выдаст нам ту же информацию, что и в предыдущем примере. В листинге 3 показано, как использовать опцию -d для вывода информации о записи директории, а не ее содержимого; также показано, как вывести записи для нескольких файлов или директорий.

Листинг 3. Использование ls –d
[ian@echidna lpi103-2]$ ls -ld ../lpi103-2 sedtab xaa
drwxrwxr-x. 2 ian ian 4096 2009-08-12 15:31 ../lpi103-2
-rw-rw-r--. 1 ian ian    8 2009-08-11 21:17 sedtab
-rw-rw-r--. 1 ian ian   15 2009-08-11 14:41 xaa

Заметьте, что время модификации директории lpi103-2 отличается от времени, которое мы видим в предыдущем листинге. Кроме того, так же, как и в предыдущем листинге, это время отличается от времени модификации любого файла в этой директории. Дело в том, что во время работы над этой статьей я создал несколько дополнительных примеров, после чего удалил их; именно об этом и говорят временные метки директории. Подробнее о временных метках файлов мы поговорим чуть позже в разделе Обработка нескольких файлов и директорий.

Сортировка вывода

По умолчанию команда ls выводит имена файлов в алфавитном порядке. Для сортировки вывода существует ряд опций. Например, команда ls -t отсортирует файлы по времени их модификации (от самых новых до самых старых), а команда ls -lS сформирует подробный список файлов, отсортированных по размеру (от самых больших до самых маленьких). Если добавить опцию -r, то сортировка будет выполнена в обратном порядке. Например, используйте команду ls -lrt для вывода подробного списка файлов, отсортированных по дате модификации в обратном порядке. Об остальных возможностях сортировки файлов и директорий вы можете узнать из man-страницы.


Копирование, перемещение и удаление файлов

Итак, мы уже знаем, как создавать файлы, но что делать, если мы хотим скопировать или переименовать их, переместить их в другое место файловой системы или даже удалить. Для этого предназначены три короткие команды:

cp
используется для копирования одного или нескольких файлов или директорий. Вы должны указать одно или несколько имен источников и одно конечное имя. Имя источника или конечное имя может включать в себя путь. Если конечным именем является имя существующей директории, то все источники будут скопированы в нее. Если директория с конечным именем не существует, то (единственный) источник должен также являться директорией; источник и его содержимое будет скопировано во вновь созданную директорию с указанным именем. Если конечным именем является имя файла, то (единственный) источник должен также являться файлом; копия источника будет создана в виде файла с указанным конечным именем, и если файл с таким именем уже существует в системе, то он будет замещен новым файлом. Обратите внимание на то, что, в отличие от операционных систем DOS и Windows, в Linux текущая директория не является по умолчанию конечной директорией .
mv
используется для перемещения или переименования одного или нескольких файлов или директорий. В общем случае правила использования имен совпадают с правилами для команды cp; вы можете переименовать отдельный файл или переместить несколько файлов в новую директорию. Поскольку имена – это всего лишь записи в директориях, указывающие на дескриптор inode, то вас не должен удивлять тот факт, что номер inode не меняется до тех пор, пока файл не перемещается в другую файловую систему (в этом случае операция перемещения больше похожа на операцию копирования с последующим удалением исходного файла).
rm
используется для удаления одного или нескольких файлов. О том, как удалять директории, я расскажу чуть позже.

Куда подевалась команда rename?

Если вы работали в операционной системе DOS или Windows®, то вам может показаться странным, что для переименования файла используется команда mv. В Linux есть команда rename, но ее синтаксис отличается от синтаксиса одноименной команды в DOS или Windows. Для получения дополнительной информации об этой команде обратитесь к man-странице.

В листинге 4 приведены примеры использования команд cp и mv для создания нескольких резервных копий наших текстовых файлов. Также мы использовали команду ls -i, чтобы показать номера индексных дескрипторов некоторых файлов.

  1. Сначала мы создали копию нашего файла text1 и назвали ее text1.bkp.
  2. Затем мы решили создать с помощь команды mkdir поддиректорию backup для хранения резервных копий.
  3. Мы создали вторую резервную копию файла text1 (на этот раз в поддиректории backup) и показали, что все три файла имеют различные дескрипторы inode.
  4. Мы переместили наш файл text1.bkp в поддиректорию backup и переименовали его в соответствии с именем второй резервной копии. Хотя это можно было сделать с помощью одной команды, для наглядности мы использовали две.
  5. Мы снова проверяем дескрипторы inode и убеждаемся в том, что файл text1.bkp c inode 934193 больше не находится в нашей директории lpi103-2, а данный номер inode теперь принадлежит файлу text1.bkp.1 в директории backup.
Листинг 4. Копирование и перемещение файлов
[ian@echidna lpi103-2]$ cp text1 text1.bkp
[ian@echidna lpi103-2]$ mkdir backup
[ian@echidna lpi103-2]$ cp text1 backup/text1.bkp.2
[ian@echidna lpi103-2]$ ls -i text1 text1.bkp backup
933892 text1  934193 text1.bkp

backup:
934195 text1.bkp.2
[ian@echidna lpi103-2]$ mv text1.bkp backup
[ian@echidna lpi103-2]$ mv backup/text1.bkp backup/text1.bkp.1
[ian@echidna lpi103-2]$ ls -i text1 text1.bkp backup
ls: cannot access text1.bkp: No such file or directory
933892 text1

backup:
934193 text1.bkp.1  934195 text1.bkp.2

Обычно команда cp перезаписывает конечный файл, если он существует и может быть перезаписан. С другой стороны, команда mv не перемещает и не переименовывает файл, если существует другой файл с таким же именем. Имеется несколько полезных опций для управления поведением команд cp и mv.

-f или --force
указывает команде cp попытаться удалить существующий файл назначения, даже если он не доступен для перезаписи.
-i или --interactive
запрашивает подтверждение при попытке заместить существующий файл.
-b или --backup
создает резервные копии всех замещаемых файлов.

Как обычно, полную информацию об этих и других опциях копирования и перемещения вы можете найти на соответствующих man-страницах.

В листинге 6 приведен пример создания резервных копий с последующим удалением исходных файлов.

Листинг 5. Создание резервных копий и удаление файлов
[ian@echidna lpi103-2]$ cp text2 backup
[ian@echidna lpi103-2]$ cp --backup=t text2 backup
[ian@echidna lpi103-2]$ ls backup
text1.bkp.1  text1.bkp.2  text2  text2.~1~
[ian@echidna lpi103-2]$ rm backup/text2 backup/text2.~1~
[ian@echidna lpi103-2]$ ls backup
text1.bkp.1  text1.bkp.2

Заметьте, что команда rm позволяет использовать опции -i (interactive – интерактивный) и -f (force – принудительный). Если файл удален с помощью rm, файловая система больше не имеет к нему доступа. В некоторых системах для пользователя root по умолчанию определен псевдоним alias rm='rm -i', позволяющий предотвратить случайное удаление файлов. Эту возможность могут использовать и обычные пользователи, которые боятся случайно удалить что-нибудь.

Перед тем, как закончить рассмотрение этой темы, следует заметить, что для новых файлов команда cp по умолчанию создает новую метку времени. Владельцем (и группой) нового файла становится пользователь (и его группа), который осуществляет копирование. Для сохранения выбранных атрибутов можно использовать опцию -p. Заметьте, что пользователь root может оказаться единственным пользователем, который может сохранять права владения. Дополнительную информацию вы можете найти на man-странице.


Создание и удаление директорий

Вы уже знаете, как создавать директории с помощью команды mkdir. Теперь пойдем дальше и рассмотрим аналог mkdir для удаления директорий – программу rmdir.

Команда mkdir

Предположим, что мы находимся в нашей директории lpi103-2 и хотим создать поддиректории dir1 и dir2. Так же, как и уже рассмотренные команды, команда mkdir может обрабатывать запросы на создание сразу нескольких директорий, как показано в листинге 6.

Листинг 6. Создание нескольких директорий
[ian@echidna lpi103-2]$ mkdir dir1 dir2

Обратите внимание на отсутствие какого-либо вывода в случае успешного выполнения команды. Чтобы убедиться в том, что код завершения действительно равен 0, вы можете использовать команду echo $?.

Если вы хотите создать вложенную поддиректорию, например, d1/d2/d3, то выполнение команды завершится с ошибкой, поскольку директорий d1 и d2 не существует. К счастью, у команды mkdir есть опция -p, позволяющая создавать любое количество родительских директорий, как показано в листинге 7.

Листинг 7. Создание родительских директорий
[ian@echidna lpi103-2]$ mkdir d1/d2/d3
mkdir: cannot create directory `d1/d2/d3': No such file or directory
[ian@echidna lpi103-2]$ echo $?
1
[ian@echidna lpi103-2]$ mkdir -p d1/d2/d3
[ian@echidna lpi103-2]$ echo $?
0

Команда rmdir

Команда rmdir предназначена для удаления директорий. Если указана опция -p, то удаляются также все родительские директории. Поскольку опции для принудительного удаления не существует, то с помощью rmdir можно удалять только пустые директории. Мы рассмотрим другой способ удаления директорий в разделе Рекурсивные действия. Когда вы познакомитесь с этим способом, возможно, уже не будете часто использовать команду rmdir в командной строке, однако, знать о ней не помешает.

Чтобы продемонстрировать удаление директории, мы скопировали наш файл text1 в директорию d1/d2, которая теперь не пуста. Затем мы выполнили команду rmdir для удаления всех директорий, которые только что были созданы с помощью mkdir. Как вы видите, директории d1 и d2 не были удалены, поскольку директория d2 содержит файлы. Все остальные директории были удалены. Как только мы удалим копию файла text1 из директории d2, мы сможем удалить директории d1и d2 с помощью единственной команды rmdir -p.

Листинг 8. Удаление директорий
[ian@echidna lpi103-2]$ cp text1 d1/d2
[ian@echidna lpi103-2]$ rmdir -p d1/d2/d3 dir1 dir2
rmdir: failed to remove directory `d1/d2': Directory not empty
[ian@echidna lpi103-2]$ ls . d1/d2
.:
backup  sedtab  text2  text4  text6  xab  yab
d1      text1   text3  text5  xaa    yaa

d1/d2:
text1
[ian@echidna lpi103-2]$ rm d1/d2/text1
[ian@echidna lpi103-2]$ rmdir -p d1/d2

Обработка нескольких файлов и директорий

До сих пор все используемые нами команды выполняли действия над отдельными файлами или, возможно, над несколькими перечисленными вручную файлами. В оставшейся части этой статьи мы рассмотрим выполнение различных операций над множеством файлов, рекурсивные действия с частью дерева каталогов, а также сохранение и восстановление множества файлов и директорий.


Рекурсивные действия

Рекурсивный вывод содержимого директорий

У команды ls имеется опция -R (обратите внимание на верхний регистр "R") для вывода содержимого директории и всех ее поддиректорий. Рекурсивная опция применяется только к именам директорий; она не найдет в дереве каталогов, например, все файлы с именем 'text1'. Вы можете использовать и другие известные вам опции совместно с опцией -R. В листинге 9 показан рекурсивный вывод содержимого нашей директории lpi103-2, включая номера дескрипторов inode.

Листинг 9. Рекурсивный вывод содержимого директории
[ian@echidna lpi103-2]$ ls -iR
.:
934194 backup  933892 text1  933898 text3  933900 text5  933894 xaa  933896 yaa
933901 sedtab  933893 text2  933899 text4  933902 text6  933895 xab  933897 yab

./backup:
934193 text1.bkp.1  934195 text1.bkp.2

Рекурсивное копирование

Вы можете использовать опцию -r (или -R или --recursive) команды cp для просмотра исходных директорий и рекурсивного копирования их содержимого. Для предотвращения бесконечной рекурсии сама исходная директория не может быть скопирована. В листинге 10 показано, как полностью скопировать содержимое нашей директории lpi103-2 в поддиректорию copy1. Для просмотра результирующего дерева каталогов мы используем команду ls -R.

Листинг 10. Рекурсивное копирование
[ian@echidna lpi103-2]$ cp -pR . copy1
cp: cannot copy a directory, `.', into itself, `copy1'
[ian@echidna lpi103-2]$ ls -R
.:
backup  copy1  sedtab  text1  text2  text3  text4  text5  text6  xaa  xab  yaa  yab

./backup:
text1.bkp.1  text1.bkp.2

./copy1:
text2  text3  text5  xaa  yaa  yab

Рекурсивное удаление

Ранее мы упоминали, что команда rmdir удаляет только пустые директории. Мы можем использовать опцию -r (или -R или --recursive) команды rm для удаления и файлов и директорий, как показано в листинге 11. В листинге 11 мы удаляем только что созданную директорию copy1 вместе с ее содержимым, включая поддиректорию backup и все файлы в ней.

Листинг 11. Рекурсивное удаление
[ian@echidna lpi103-2]$ rm -r copy1
[ian@echidna lpi103-2]$ ls -R
.:
backup  sedtab  text1  text2  text3  text4  text5  text6  xaa  xab  yaa  yab

./backup:
text1.bkp.1  text1.bkp.2

Если имеются файлы, не доступные вам для записи, то может потребоваться опция -f для принудительного удаления. Это часто используется пользователем root во время очистки системы, однако имейте в виду, что при неосторожном использовании этой опции вы можете потерять важные данные.


Метасимволы и подстановка имен файлов

Часто возникает необходимость выполнить простую операцию над множеством объектов файловой системы, не оперируя целым деревом каталогов, как мы только что делали при выполнении рекурсивных действий. Например, вам может потребоваться узнать время модификации всех текстовых файлов, которые были созданы в директории lpi103-2, не выводя список отдельных файлов. Хотя это достаточно просто сделать для нашей небольшой директории, для больших файловых систем все оказывается намного сложнее.

Для решения этой проблемы используйте поддержку метасимволов, встроенную в интерпретатор bash. Эта поддержка также называется подстановкой имен ("globbing" – название, произошедшее от имени программы /etc/glob) и позволяет вам определять множество файлов с помощью шаблонов подстановки.

Строка, содержащая любой из символов '?', '*' или '[', называется шаблоном подстановки. Подстановка – это процесс, в котором интерпретатор (а, возможно, другая программа) замещает шаблоны списком соответствующих им путей. Соответствия определяются следующим образом:

?
соответствует любому одиночному символу.
*
соответствует любой строке, включая пустую строку.
[
представляет класс символов. Класс символов – это непустая строка, оканчивающаяся символом ']'. Соответствие означает совпадение с любым отдельным символом, заключенным в квадратные скобки. Существует несколько специальных соглашений:
  • Символы '*' и '?' означают сами себя. Если вы используете их в именах файлов, необходимо уделять внимание правильному использованию кавычек и escape-последовательностей.
  • Поскольку строка не должна быть пустой и оканчивается символом ']', вы должны помещать символ ']' первым в строке, если хотите найти для него соответствие.
  • Символ '-', помещенный между двумя другими символами, означает диапазон, включающий в себя эти два символа, а также все символы между ними в соответствии со схемой упорядочения. Например, конструкция [0-9a-fA-F] соответствует любой шестнадцатеричной цифре в нижнем или верхнем регистре. Если вы хотите найти соответствие для символа '-', помещайте его либо первым, либо последним в диапазоне.
  • Символ '!', помещенный в первой позиции диапазона, означает, что диапазону будут соответствовать любые символы, за исключением указанных в нем. Например, конструкция [!0-9] соответствует любому символу за исключением цифр от 0 до 9. Символ '!', помещенный в любой другой позиции диапазона, соответствует самому себе. Помните, что символ '!' также используется в истории командного интерпретатора, поэтому будьте внимательны и аккуратно используйте его.

Примечание. Шаблоны подстановки и регулярные выражения имеют определенные сходства, однако это не одно и то же. Обратите на это особое внимание!

Подстановка применяется отдельно к каждому компоненту имени пути. Вы не можете задать соответствие символу '/' или включить его в диапазон. Вы можете использовать его в любом месте для указания нескольких файлов или имен директорий, например, в командах ls, cp, mv или rm. В листинге 12 мы сначала создаем несколько файлов со странными именами, а затем используем команды ls и rm совместно с шаблонами подстановки.

Листинг 12. Примеры шаблонов подстановки
[ian@echidna lpi103-2]$ echo odd1>'text[*?!1]'
[ian@echidna lpi103-2]$ echo odd2>'text[2*?!]'
[ian@echidna lpi103-2]$ ls
backup  text1       text2       text3  text5  xaa  yaa
sedtab  text[*?!1]  text[2*?!]  text4  text6  xab  yab
[ian@echidna lpi103-2]$ ls text[2-4]
text2  text3  text4
[ian@echidna lpi103-2]$ ls text[!2-4]
text1  text5  text6
[ian@echidna lpi103-2]$ ls text*[2-4]*
text2  text[2*?!]  text3  text4
[ian@echidna lpi103-2]$ ls text*[!2-4]* # Surprise!
text1  text[*?!1]  text[2*?!]  text5  text6
[ian@echidna lpi103-2]$ ls text*[!2-4] # Another surprise!
text1  text[*?!1]  text[2*?!]  text5  text6
[ian@echidna lpi103-2]$ echo text*>text10
[ian@echidna lpi103-2]$ ls *\!*
text[*?!1]  text[2*?!]
[ian@echidna lpi103-2]$ ls *[x\!]*
text1  text[*?!1]  text10  text2  text[2*?!]  text3  text4  text5  text6  xaa  xab
[ian@echidna lpi103-2]$ ls *[y\!]*
text[*?!1]  text[2*?!]  yaa  yab
[ian@echidna lpi103-2]$ ls tex?[[]*
text[*?!1]  text[2*?!]
[ian@echidna lpi103-2]$ rm tex?[[]*
[ian@echidna lpi103-2]$ ls *b*
sedtab  xab  yab

backup:
text1.bkp.1  text1.bkp.2
[ian@echidna lpi103-2]$ ls backup/*2
backup/text1.bkp.2
[ian@echidna lpi103-2]$ ls -d .*
.  ..

Примечания:

  1. Образование дополнения совместно с символом '*' может привести к некоторым сюрпризам. Шаблон '*[!2-4]' соответствует самой длинной части имени, после которой не следуют цифры 2, 3 или 4, что соответствует как имени text[*?!1], так и имени text[2*?!].
  2. Так же, как и в предыдущих примерах команды ls, если удовлетворяющее шаблону имя является именем директории, и опция -d не указана, то будет выведен список содержимого этой директории (как в случае с шаблоном '*b*' из нашего примера).
  3. Если имя файла начинается с точки (.), то этот символ должен быть указан явно. Заметьте, что только последняя команда ls отобразила две специальных записи (. и ..).

Помните, что любой групповой символ обрабатывается командным интерпретатором, что может привести к непредсказуемым результатам. Более того, если вы зададите шаблон подстановки, которому не соответствует ни один объект файловой системы, то в соответствии со стандартом POSIX требуется, чтобы команде была передана исходная строка шаблона. Некоторые более ранние версии передавали команде пустой список, поэтому вам могут встретиться старые сценарии, которые ведут себя необычно. Проиллюстрируем сказанное в листинге 13.

Листинг 13. Сюрпризы при использовании шаблонов подстановки
[ian@echidna lpi103-2]$ echo text*
text1 text10 text2 text3 text4 text5 text6
[ian@echidna lpi103-2]$ echo "text*"
text*
[ian@echidna lpi103-2]$ echo text[[\!?]z??
text[[!?]z??

Для получения дополнительной информации о подстановке имен обратитесь к man-странице man 7 glob. Необходимо указать номер раздела, поскольку информация о подстановке содержится также в разделе 3. Лучший способ научиться работать с шаблонами подстановки – это практика, поэтому пробуйте использовать метасимволы каждый раз, когда вам представится эта возможность. Чтобы избежать непоправимых действий, не забывайте проверять ваши шаблоны подстановки с помощью ls, а уже потом применять к ним такие команды, как cp, mv или, тем более, rm.


Использование touch

В этом разделе мы рассмотрим команду touch, которая может обновлять время доступа к файлу или время его модификации, а также создавать пустые файлы. Вы увидите, как использовать эту информацию для поиска файлов и директорий. В наших примерах мы продолжим использовать директорию lpi103-2. Также мы рассмотрим различные способы задания временных меток.

Команда touch

Команда touch, запущенная без каких-либо опций, принимает в качестве параметров один или несколько имен файлов и обновляет время их модификации – значение, которое обычно отображается при подробном выводе содержимого директорий. В листинге 14 мы используем хорошо знакомую нам команду echo для создания небольшого файла с именем f1, а затем выводим содержимое директории в подробном виде для отображения времени модификации (или mtime). В данном случае временем модификации будет являться время создания файла. Затем мы используем команду sleep, чтобы подождать 60 секунд, и запускаем команду ls снова. Заметьте, что временная метка файла изменилась на одну минуту.

Листинг 14. Обновление времени последнего изменения при помощи touch
[ian@echidna lpi103-2]$ echo xxx>f1; ls -l f1; sleep 60; touch f1; ls -l f1
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:24 f1
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 f1

Если вы укажете имя несуществующего файла, то команда touch создаст пустой файл с этим именем (если не используется опция -c или --no-create). В листинге 15 приведены примеры обеих команд. Обратите внимание на то, что был создан только файл f2.

Листинг 15. Создание пустых файлов при помощи touch
[ian@echidna lpi103-2]$ touch f2; touch -c f3; ls -l f*
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:27 f2

С помощью опции -d или -t команды touch можно также устанавливать дату и время модификации файлов (также известное как mtime) соответственно. Опция -d понимает много различных форматов даты и времени, тогда как опция -t требует, чтобы время было указано в формате MMDDhhmm (год и секунды являются необязательными параметрами). В листинге 16 приведено несколько примеров.

Листинг 16. Установка mtime при помощи touch
[ian@echidna lpi103-2]$ touch -t 200908121510.59 f3
[ian@echidna lpi103-2]$ touch -d 11am f4
[ian@echidna lpi103-2]$ touch -d "last fortnight" f5
[ian@echidna lpi103-2]$ touch -d "yesterday 6am" f6
[ian@echidna lpi103-2]$ touch -d "2 days ago 12:00" f7
[ian@echidna lpi103-2]$ touch -d "tomorrow 02:00" f8
[ian@echidna lpi103-2]$ touch -d "5 Nov" f9
[ian@echidna lpi103-2]$ ls -lrt f*
-rw-rw-r--. 1 ian ian 0 2009-07-31 18:31 f5
-rw-rw-r--. 1 ian ian 0 2009-08-12 12:00 f7
-rw-rw-r--. 1 ian ian 0 2009-08-12 15:10 f3
-rw-rw-r--. 1 ian ian 0 2009-08-13 06:00 f6
-rw-rw-r--. 1 ian ian 0 2009-08-14 11:00 f4
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:27 f2
-rw-rw-r--. 1 ian ian 0 2009-08-15 02:00 f8
-rw-rw-r--. 1 ian ian 0 2009-11-05 00:00 f9

Если вы затрудняетесь составить выражение для нужной даты, то вы можете определиться с помощью команды date. Эта команда также имеет опцию -d и может понимать те же самые форматы даты, что и команда touch.

Вы можете использовать опцию -r (или --reference) совместно с именем ссылочного файла, чтобы указать программе touch (или date) на то, что она должна установить дату в соответствии с временной меткой существующего файла. В листинге 17 приведено несколько примеров.

Листинг 17. Временные метки ссылочных файлов
[ian@echidna lpi103-2]$ date
Fri Aug 14 18:33:48 EDT 2009
[ian@echidna lpi103-2]$ date -r f1
Fri Aug 14 18:25:50 EDT 2009
[ian@echidna lpi103-2]$ touch -r f1 f1a
[ian@echidna lpi103-2]$ ls -l f1*
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 f1a

Система Linux записывает как время модификации файла, так и время доступа к файлу (mtime и atime соответственно). Обе временные метки имеют одинаковое значение в момент создания файла и вместе сбрасываются при его изменении. Если было выполнено обращение к файлу, то обновляется время доступа, даже если файл не был модифицирован. В нашем последнем примере работы с командой touch мы рассмотрим время доступа. Опция -a (или --time=atime, --time=access или --time=use) указывает на то, что время доступа необходимо обновить. В листинге 18 мы используем команду cat для обращения к файлу f1 и вывода его содержимого. Затем мы используем команды ls -l и ls -lu для вывода времени модификации и времени доступа, соответственно, для файлов f1 и f1a, который мы создали, используя файл f1 в качестве ссылочного файла. В заключение, с помощью touch -a мы меняем время доступа файла f1 на время доступа файла f1a и проверяем результат.

Листинг 18. Время доступа и время модификации
[ian@echidna lpi103-2]$ ls -lu f1*
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:39 f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 f1a
[ian@echidna lpi103-2]$ ls -l f1*
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 f1a
[ian@echidna lpi103-2]$ touch -a -r f1a f1
[ian@echidna lpi103-2]$ ls -lu f1*
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 f1a

Более полную информацию о различных спецификациях времени и даты вы можете получить на man- или info-страницах команд touch и date.


Поиск файлов

Теперь, когда наша тема о файлах и директориях была исчерпана молотом рекурсии и подстановок, давайте рассмотрим команду find, которая больше похожа на хирургический скальпель. Команда find используется для поиска файлов в дереве каталогов на основе их имени, даты или размера. В этот раз мы снова будем использовать нашу директорию lpi103-2.

Команда find

Команда find выполняет поиск файлов или директорий, используя полное имя или его часть; поиск может выполняться и по другим критериям, таким как размер, тип, владелец, дата создания или последнего обращения. Наиболее распространенным является поиск по имени или по его части. В листинге 19 приведено несколько примеров поиска файлов: сначала мы ищем в директории lpi103-2 все файлы, в названии которых содержится символ '1' или 'k', а затем выполняем поиск путей, о котором подробно поясняется в примечаниях.

Листинг 19. Поиск файлов по имени
[ian@echidna lpi103-2]$ find . -name "*[1k]*"
./f1a
./f1
./text10
./backup
./backup/text1.bkp.1
./backup/text1.bkp.2
./text1
[ian@echidna lpi103-2]$ find . -ipath "*ACK*1"
./backup/text1.bkp.1
[ian@echidna lpi103-2]$ find . -ipath "*ACK*/*1"
[

Примечания:

  1. Вы можете использовать при поиске те же шаблоны подстановок, что были рассмотрены в разделе Метасимволы и подстановка имен файлов.
  2. Чтобы находить полные пути, а не просто имена файлов, вместо опции -name вы можете использовать опцию -path. В этом случае шаблон может охватывать несколько компонентов пути, в отличие от обычных шаблонов, которые соответствуют только одной части пути.
  3. Если необходимо выполнить регистро-независимый поиск, как показано в примере с использованием ipath, то ставьте перед опциями команды find, выполняющими поиск на основе строки или шаблона, символ 'i'.
  4. Если необходимо найти файл или директорию, имя которой начинается с точки (например, директорию .bashrc или текущую директорию .), то в начале вашего шаблона должна стоять точка. В противном случае эти имена будут проигнорированы при поиске.

В первом примере листинга 19 мы нашли как файлы, так и директорию (./backup). Чтобы ограничить поиск, используйте параметр -type совместно с указанием типа (значение, состоящее из одного символа): 'f' – обычные файлы, 'd' – директории, 'l' – символические ссылки. О других типах вы можете узнать на man-странице команды find. В листинге 20 представлены результаты поиска директорий (параметр -type d) с указанием имени (*, что в данном случае означает все директории).

Листинг 20. Поиск файлов по типу
[ian@echidna lpi103-2]$ find . -type d
.
./backup
[ian@echidna lpi103-2]$ find . -type d -name "*"
.
./backup

Обратите внимание на то, что параметр -type d без указания имени выводит директории, имена которых начинаются с точки (в нашем случае только текущая директория); этот же результат достигается при использовании группового символа "*".

Можно также выполнять поиск файлов по их размеру; можно искать файлы определенного размера (n), а также файлы, размер которых больше (+n) или меньше (-n) заданного значения. Задавая начальные и конечные значения, можно искать файлы, размер которых попадает в заданный диапазон. По умолчанию опция -size команды find использует единицу измерения 'b' – блоки, размером в 512 байтов. Другими единицами измерения могут быть 'c' (байты) или 'k' (килобайты). В листинге 21 мы сначала находим все файлы с нулевым размером, а затем все файлы, размером в 24 или 25 байтов. Обратите внимание на то, что если указать вместо опции -size 0 опцию -empty, то также будут найдены все файлы с нулевым размером.

Листинг 21. Поиск файлов по размеру
[ian@echidna lpi103-2]$ find . -size 0
./f1a
./f6
./f8
./f2
./f3
./f7
./f4
./f9
./f5
[ian@echidna lpi103-2]$ find . -size -26c -size +23c -print
./text2
./text5
./backup/text1.bkp.1
./backup/text1.bkp.2
./text1

Во втором примере листинга 21 мы используем опцию -print, являющуюся примером действия, которое может быть выполнено над результатами поиска. В интерпретаторе bash это действие выполняется по умолчанию, если не указаны другие действия. В некоторых системах и командных интерпретаторах действие должно быть обязательно указано, в противном случае вы не увидите никаких результатов на экране.

Другими действиями являются -ls (вывод информации о файле, аналогичный выводу команды ls -lids) и -exec (выполнение команды для каждого файла). Действие -exec должно оканчиваться точкой с запятой, чтобы интерпретатор не воспринимал его как обычный набор команд. Также поставьте {} в любом месте команды, в котором должен использоваться возвращаемый файл. Не забывайте, что командный интерпретатор обрабатывает фигурные скобки, поэтому их необходимо указывать в виде escape-последовательностей (или заключать в кавычки). В листинге 22 показан пример использования опций -ls и -exec для вывода информации о файлах. Обратите внимание на то, что во втором примере не выводится информация об индексных дескрипторах inode.

Листинг 22. Поиск и выполнение действий над файлами
[ian@echidna lpi103-2]$ find . -size -26c -size +23c -ls
933893    4 -rw-rw-r--   1 ian      ian            25 Aug 11 14:27 ./text2
933900    4 -rw-rw-r--   1 ian      ian            24 Aug 11 18:47 ./text5
934193    4 -rw-rw-r--   1 ian      ian            24 Aug 12 15:36 ./backup/text1.bkp.1
934195    4 -rw-rw-r--   1 ian      ian            24 Aug 12 15:36 ./backup/text1.bkp.2
933892    4 -rw-rw-r--   1 ian      ian            24 Aug 11 14:02 ./text1
[ian@echidna lpi103-2]$ find . -size -26c -size +23c -exec ls -l '{}' \;
-rw-rw-r--. 1 ian ian 25 2009-08-11 14:27 ./text2
-rw-rw-r--. 1 ian ian 24 2009-08-11 18:47 ./text5
-rw-rw-r--. 1 ian ian 24 2009-08-12 15:36 ./backup/text1.bkp.1
-rw-rw-r--. 1 ian ian 24 2009-08-12 15:36 ./backup/text1.bkp.2
-rw-rw-r--. 1 ian ian 24 2009-08-11 14:02 ./text1

Опцию -exec можно использовать для различных задач, и ее возможности ограничены лишь вашим воображением. Например, команда

find . -empty -exec rm '{}' \;

удаляет из дерева каталогов все пустые файлы, а команда

find . -name "*.htm" -exec mv '{}' '{}l' \;

переименовывает все файлы с расширением .htm на файлы с расширением .html.

В нашем последнем примере команды find мы выполняем поиск файлов на основе определенных временных меток (с которыми работает команда touch). Листинг 23 содержит три примера.

  1. При использовании опции -mtime -2 команда find ищет все файлы, которые были изменены за последние два дня. В данном случае день – это 24 часа начиная с текущего момента. Заметьте, что если бы вам требовалось найти файлы на основе времени доступа, а не времени модификации, то можно использовать для этого опцию -atime.
  2. Добавление опции -daystart означает, что мы хотим выполнять отсчет в календарных днях, начиная с полуночи. Таким образом, в этом примере отсутствует файл f3.
  3. В последнем примере мы демонстрируем использование временного диапазона, заданного в минутах, а не в днях, для поиска файлов, которые были изменены от часа (60 минут) до десяти часов (600 минут) назад.
Листинг 23. Поиск файлов по временным меткам
[ian@echidna lpi103-2]$ date
Sat Aug 15 00:27:36 EDT 2009
[ian@echidna lpi103-2]$ find . -mtime -2 -type f -exec ls -l '{}' \;
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 ./f1a
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 ./f1
-rw-rw-r--. 1 ian ian 0 2009-08-13 06:00 ./f6
-rw-rw-r--. 1 ian ian 0 2009-08-15 02:00 ./f8
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:27 ./f2
-rw-rw-r--. 1 ian ian 58 2009-08-14 17:30 ./text10
-rw-rw-r--. 1 ian ian 0 2009-08-14 11:00 ./f4
-rw-rw-r--. 1 ian ian 0 2009-11-05 00:00 ./f9
[ian@echidna lpi103-2]$ find . -daystart -mtime -2 -type f -exec ls -l '{}' \;
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 ./f1a
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 ./f1
-rw-rw-r--. 1 ian ian 0 2009-08-15 02:00 ./f8
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:27 ./f2
-rw-rw-r--. 1 ian ian 58 2009-08-14 17:30 ./text10
-rw-rw-r--. 1 ian ian 0 2009-08-14 11:00 ./f4
-rw-rw-r--. 1 ian ian 0 2009-11-05 00:00 ./f9
[ian@echidna lpi103-2]$ find . -mmin -600 -mmin +60 -type f -exec ls -l '{}' \;
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:25 ./f1a
-rw-rw-r--. 1 ian ian 4 2009-08-14 18:25 ./f1
-rw-rw-r--. 1 ian ian 0 2009-08-14 18:27 ./f2
-rw-rw-r--. 1 ian ian 58 2009-08-14 17:30 ./text10

В нашем кратком руководстве мы не может познакомить вас со всеми многочисленными опциями команды find. Если вы хотите узнать больше об этой команде, то обратитесь к соответствующим man-страницам.


Определение типа файла

Часто файлы имеют расширения (такие как gif, jpeg или html), которые позволяют понять, что может находиться внутри файла. В Linux такие расширения не являются обязательными и, как правило, не используются для определения типов файлов. Если вы знаете тип файла, вы можете выбрать подходящую программу для работы с ним. Команда file позволяет получить некоторую информацию о типе данных, хранящихся в одном или нескольких файлах. В листинге 24 приведено несколько примеров использования команды file.

Листинг 24. Определение содержимого файла
[ian@echidna lpi103-2]$ file backup text1 f2 ../p-ishields.jpg /bin/echo
backup:            directory
text1:             ASCII text
f2:                empty
../p-ishields.jpg: JPEG image data, JFIF standard 1.02
/bin/echo:         ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically 
linked (uses shared libs), for GNU/Linux 2.6.18, stripped

Команда file пытается проанализировать каждый файл с помощью трех различных проверок. Проверки файловой системы используют результаты команды stat для определения того, чем является файл, например, он может являться пустым файлом или директорией. Так называемые magic проверки выполняют поиск в файлах определенного содержимого, позволяющего идентифицировать их. Эти идентификационные сигнатуры также известны как magic numbers. И наконец, языковые проверки проверяют содержимое текстовых файлов и пытаются определить их тип (XML-файл, исходный код на C или C++, файл troff или любой другой файл с исходным кодом какого-либо языкового процессора). Если не указана опция -k или --keep-going, то выводится информация о первом найденном типе файла, а дальнейшие проверки прекращаются.

Команда file имеет много опций, о которых вы можете узнать из man-страниц. В листинге 25 показано, как использовать опцию -i (или --mime) для вывода типа файла в виде MIME строки.

Листинг 25. Определение содержимого файла в виде MIME
[ian@echidna lpi103-2]$ file -i backup text1 f2 ../p-ishields.jpg /bin/echo
backup:            application/x-directory; charset=binary
text1:             text/plain; charset=us-ascii
f2:                application/x-empty; charset=binary
../p-ishields.jpg: image/jpeg; charset=binary
/bin/echo:         application/x-executable; charset=binary

Команда file также работает и с файлами, содержащими сигнатуры magic number. Дополнительную информацию вы можете найти на man-страницах.

Примечание. Команда identify из состава пакета ImageMagick является дополнительным инструментом, позволяющим получить более подробную информацию о графических файлах.


Сжатие файлов

При создании резервных копий файлов, а также при их архивировании или передаче обычно применяется сжатие. Две популярных программы для сжатия файлов в Linux – это gzip и bzip2. Команда gzip использует алгоритм Лемпеля-Зива, а команда bzip2 – блочно-сортирующий алгоритм Барроуза-Уилера.

Программы gzip и gunzip

Обычно наибольшая степень сжатия достигается при обработке текстовых файлов. Многие графические форматы уже являются сжатыми, поэтому для них (а, возможно, и для других двоичных файлов) сжатие может оказаться малоэффективным. Чтобы продемонстрировать результаты сжатия достаточно объемного текстового файла, давайте скопируем файл /etc/services в нашу директорию и сожмем его с помощью gzip, как показано в листинге 26. Мы используем опцию -p команды cp для сохранения метки времени файла /etc/services. Обратите внимание на то, что сжатый файл имеет расширение .gz и ту же самую метку времени.

Листинг 26. Сжатие с помощью gzip
[ian@echidna lpi103-2]$ cp -p /etc/services .
[ian@echidna lpi103-2]$ ls -l serv*
-rw-r--r--. 1 ian ian 630983 2009-04-10 04:42 services
[ian@echidna lpi103-2]$ gzip services
[ian@echidna lpi103-2]$ ls -l serv*
-rw-r--r--. 1 ian ian 124460 2009-04-10 04:42 services.gz

Файлы, сжатые с помощью gzip, распаковываются той же самой программой, запущенной с опцией -d, или командой gunzip (второй способ более распространен). В листинге 27 продемонстрирован первый способ. Обратите внимание на то, что имя и временная метка распакованного файла совпадают с исходным файлом.

Листинг 27. Распаковка с помощью gzip
[ian@echidna lpi103-2]$ gzip -d services.gz
[ian@echidna lpi103-2]$ ls -l serv*
-rw-r--r--. 1 ian ian 630983 2009-04-10 04:42 services

Команды bzip2 и bunzip2

Как видно из листинга 28, работа команды bzip2 аналогична работе команды gzip.

Листинг 28. Сжатие с помощью bzip2
[ian@echidna lpi103-2]$ ls -l serv*
-rw-r--r--. 1 ian ian 630983 2009-04-10 04:42 services
[ian@echidna lpi103-2]$ bzip2 services
[ian@echidna lpi103-2]$ ls -l serv*
-rw-r--r--. 1 ian ian 113444 2009-04-10 04:42 services.bz2
[ian@echidna lpi103-2]$ bunzip2 services.bz2
[ian@echidna lpi103-2]$ ls -l serv*
-rw-r--r--. 1 ian ian 630983 2009-04-10 04:42 services

Различия между gzip и bzip2

Хотя программы bzip2 и gzip имеют много одинаковых опций, они не идентичны. Вы могли заметить, что в обоих примерах распакованный файл имел те же имя и метку времени, что и исходный файл. Тем не менее, в результате переименования файла или выполнения над ним команды touch это поведение может измениться. У команды gzip имеется опция -N или --name, которая позволяет сохранять имя и временную метку, однако такой опции нет у команды bzip2. Также у команды gzip имеется опция -l для вывода информации о сжатом файле, включая имя, которое он получит после распаковки. В листинге 29 показаны некоторые различия между этими командами.

Листинг 29. Некоторые различия между gzip и bzip2
[ian@echidna ~]$ ls -l serv*
-rw-r--r--. 1 ian ian 630983 2009-04-10 04:42 services
[ian@echidna ~]$ gzip -N services
[ian@echidna ~]$ touch services.gz
[ian@echidna ~]$ mv services.gz services-x.gz
[ian@echidna ~]$ ls -l serv*
-rw-r--r--. 1 ian ian 124460 2009-09-23 14:08 services-x.gz
[ian@echidna ~]$ gzip -l services-x.gz
         compressed        uncompressed  ratio uncompressed_name
             124460              630983  80.3% services-x
[ian@echidna ~]$ gzip -lN services-x.gz
         compressed        uncompressed  ratio uncompressed_name
             124460              630983  80.3% services
[ian@echidna ~]$ gunzip -N services-x.gz
[ian@echidna ~]$ ls -l serv*
-rw-r--r--. 1 ian ian 630983 2009-04-10 04:42 services
[ian@echidna ~]$
[ian@echidna ~]$ bzip2 services
[ian@echidna ~]$ mv services.bz2 services-x.bz2
[ian@echidna ~]$ touch services-x.bz2
[ian@echidna ~]$ ls -l serv*
-rw-r--r--. 1 ian ian 113444 2009-09-23 14:10 services-x.bz2
[ian@echidna ~]$ bunzip2 services-x.bz2
[ian@echidna ~]$ ls -l serv*
-rw-rw-r--. 1 ian ian 630983 2009-09-23 14:10 services-x
[ian@echidna ~]$ rm services-x # Don't need this any more

И gzip, и bzip2 получают входные данные с устройства stdin. У обеих команд имеется опция -c для направления вывода на устройство stdout.

С командой bzip2 связаны две другие команды.

  1. Команда bzcat распаковывает файлы на устройство stdout и эквивалентна команде bzip2 -dc.
  2. Команда bzip2recover пытается восстановить данные из поврежденных файлов bzip2.

Дополнительную информацию о командах gzip и bzip2 вы можете найти на соответствующих man-страницах.

Другие инструменты для сжатия

В системах Linux и UNIX все еще часто встречаются две более старых программы – compress и uncompress.

Кроме того, для операционной системы Linux в рамках проекта Info-ZIP разработаны утилиты zip и unzip. В этих программах используются кроссплатформенные функции сжатия, работающие на различном оборудовании под управлением различных операционных систем. Имейте в виду, что в различных операционных системах могут использоваться различные файловые атрибуты и возможности файловых систем. Если вы загрузите сжатый установочный zip-файл, распакуете его в операционной системе Windows, а затем запишете на компакт- или DVD-диск для последующей установки в Linux, то при установке с этого диска могут возникнуть проблемы; например, в ОС Windows отсутствует поддержка символических ссылок, которые могут оказаться частью несжатого исходного набора файлов.

Для получения дополнительной информации об этих и других программах, предназначенных для сжатия и распаковки, обратитесь к соответствующим man-страницам.


Архивирование файлов

Для создания резервных копий групп файлов или даже целых разделов, а также для архивирования и передачи файлов на другой компьютер или другому пользователю широко применяются команды tar, cpio и dd. Вопросы резервного копирования подробно рассматриваются в экзамене LPI 201 на администратора среднего уровня (LPIC-2).

Существует три основных подхода к резервному копированию.

  1. Дифференциальное или кумулятивное архивирование – резервирование всех данных, которые изменились с момента создания последнего полного архива. Для восстановления данных необходимо иметь последний полный архив и самый последний дифференциальный архив.
  2. Инкрементное архивирование – резервирование только тех изменений, которые наступили с момента создания последнего инкрементного архива. Для восстановления данных необходимо иметь последний полный архив и все инкрементные архивы (по порядку), созданные после создания полного архива.
  3. Полное архивирование – резервирование всех данных целиком (обычно это файловая система, директория или группа файлов). Поскольку в этом случае время создания архива оказывается максимальным, то этот подход используется совместно с двумя другими.

Эти команды, а также другие команды, о которых вам уже известно из этой статьи, позволяют создавать резервные копии любым из трех вышеперечисленных способов.

Команда tar

Команда tar (исходное название Tape ARchive) создает архивный файл (другое его название tarfile или tarball) из нескольких файлов или директорий, а также извлекает файлы из созданных архивов. Если вы передали на вход команде tar имя директории, то в архив автоматически будут включены все находящиеся в ней файлы и поддиректории; благодаря этому tar очень удобно использовать для архивирования целых веток дерева каталогов.

Вывод может быть направлен в файл, на устройство архивирования (например, ленточный накопитель или другой сменный накопитель) или на стандартное устройство вывода stdout. Конечное местоположение указывается с помощью опции -f. Другими наиболее часто используемыми опциями являются -c (создать архив), -x (распаковать архив), -v (вывод подробного списка, содержащего имена обрабатываемых файлов), -z (использовать сжатие gzip) и -j (использовать сжатие bzip2). Большинство опций команды tar можно указывать кратко, используя одиночный дефис, и подробно, используя двойной дефис. Краткая форма показана в нашем примере. Информацию о дополнительных опциях и о подробной форме их записи вы можете найти на man-страницах.

В листинге 30 показано, как создать резервную копию нашей директории lpi103-2 с помощью tar.

Листинг 30. Создание резервной копии директории lpi103-2 с помощью tar
[ian@echidna lpi103-2]$ tar -cvf ../lpitar1.tar .
./
./text3
./yab
...
./f5

Обычно архивные файлы сжимаются для экономии дискового пространства или времени передачи архива. GNU-версия программы tar позволяет одновременно выполнять обе операции при помощи опции -z (сжатие с помощью gzip) или -b (сжатие с помощью bzip2). В листинге 31 приведен пример использования опции -z, а также показаны различия в размерах двух архивных файлов.

Листинг 31. Сжатие tar архива с помощью gzip
[ian@echidna lpi103-2]$ tar -zcvf ../lpitar2.tar ~/lpi103-2/
tar: Removing leading `/' from member names
/home/ian/lpi103-2/
/home/ian/lpi103-2/text3
/home/ian/lpi103-2/yab
...
/home/ian/lpi103-2/f5
[ian@echidna lpi103-2]$ ls -l ../lpitar*
-rw-rw-r--. 1 ian ian 30720 2009-09-24 15:38 ../lpitar1.tar
-rw-rw-r--. 1 ian ian   881 2009-09-24 15:39 ../lpitar2.tar

В листинге 31 используется еще одна важная функция tar. Мы указали абсолютный путь для нашей директории и видим, что в первой строке вывода tar сообщает о том, что из имен файлов удаляется вводный символ косой черты (/). Это позволяет восстанавливать файлы в любые другие местоположения для их проверки и играет особо важную роль при восстановлении системных файлов. Если же вам все-таки необходимо сохранить абсолютные пути, используйте для этого опцию -p. Избегайте совместного использования абсолютных и относительных путей при создании архива, поскольку при восстановлении из архива все пути станут относительными.

Команда tar может добавлять файлы к существующему архиву; для этого используется опция -r или --append. В результате в архив могут быть добавлены несколько копий одного и того же файла. В этом случае при извлечении из архива будет восстановлен тот файл, который был добавлен последним. Чтобы восстановить определенную копию файла, используйте опцию --occurrence. Если архив хранится не на ленте, а в обычной файловой системе, то можно использовать опцию -u или --update для его обновления. В этом случае операция обновления похожа на операцию добавления файлов за исключением того, что временные метки файлов в архиве сравниваются с временными метками добавляемых файлов, и добавляются только те файлы, которые были изменены с момента создания архива. Как уже упоминалось, это не работает при использовании архивов на ленте.

Команда tar может сравнивать архивы с текущей файловой системой и извлекать файлы из архивов. Для сравнения используется опция -d, --compare или --diff. В результате сравнения будут показаны все файлы с отличающимся содержимым, а также все файлы с отличающимися временными метками. По умолчанию выводятся только различающиеся файлы (если они есть). Для подробного вывода используйте рассмотренную ранее опцию -v. Опция -C или --directory указывает команде tar выполнять операцию, начиная с указанной директории, а не с текущей.

В листинге 32 приведено несколько примеров. С помощью команды touch мы изменили временную метку файла f1, а затем выполнили сравнение, прежде чем извлечь файл f1 из одного из наших архивов. Чтобы продемонстрировать возможности tar, мы использовали различные опции.

Листинг 32. Сравнение и восстановление с помощью tar
[ian@echidna lpi103-2]$ touch f1
[ian@echidna lpi103-2]$ tar --diff --file ../lpitar1.tar .
./f1: Mod time differs
[ian@echidna lpi103-2]$ tar -df ../lpitar2.tar -C /
home/ian/lpi103-2/f1: Mod time differs
[ian@echidna lpi103-2]$ tar -xvf ../lpitar1.tar ./f1 # See below
./f1
[ian@echidna lpi103-2]$ tar --compare -f ../lpitar2.tar --directory /

Имена извлекаемых из архива файлов или директорий должны соответствовать их именам в архиве. В нашем примере попытка восстановить файл f1 вместо ./f1 окончится неудачей. Вы можете использовать подстановку имен, однако будьте внимательны, иначе в результате может быть извлечено не совсем то, что вам было нужно. Если вы хотите посмотреть, что хранится в архиве, используйте опцию --list или -t для получения списка его содержимого. В листинге 33 приведен пример использования групповых символов, в результате чего из архива извлекается не только файл ./f1.

Листинг 33. Просмотр содержимого архива с помощью tar
[ian@echidna lpi103-2]$ tar -tf ../lpitar1.tar "*f1*"
./f1a
./f1

Вы можете выбирать файлы, которые необходимо поместить в архив, с помощью команды find, а затем передавать по конвейеру результаты поиска на вход команде tar. Мы рассмотрим этот способ при изучении команды cpio, но он также работает и с командой tar.

Как и в случае с другими командами, которые встречаются в наших учебных руководствах, мы не можем рассмотреть все опции команды tar. Для получения дополнительной информации обращайтесь к man- или info-страницам.

Команда cpio

Команда cpio работает в трех режимах: copy-out для создания архива, copy-in для извлечения из архива и copy-pass для копирования набора файлов из одного местоположения в другое. Для режима copy-out используется опция -o или --create, для режима copy-in – опция -i или --extract и, наконец, для режима copy-pass – опция -p или --pass-through. Список входных файлов команда получает со стандартного устройства ввода stdin. Вывод направляется либо на стандартное устройство вывода stdout, либо на устройство или в файл, указанный с помощью опции -f или --file.

В листинге 34 показано, как сгенерировать список файлов с помощью команды find и передать их команде cpio. Обратите внимание на использование опции -print0 команды find для генерации имен файлов в виде строк с завершающим нулем, а также на соответствующую опцию --null команды cpio, позволяющую считывать данные в этом формате. Использование этих опций позволяет обрабатывать имена файлов, содержащих символы пробела или новой строки. Опция -depth указывает команде find вывести записи директории перед именем директории. В нашем примере мы создаем два архива нашей директории lpi103-2: один архив с относительными путями, второй – с абсолютными. Мы не используем различные возможности команды find для ограничения списка файлов (например, поиск только тех файлов, которые были изменены на этой неделе).

Листинг 34. Создание резервной копии директории с помощью cpio
[ian@echidna lpi103-2]$ find . -depth -print0 | cpio --null -o > ../lpicpio.1
3 blocks
[ian@echidna lpi103-2]$ find ~/lpi103-2/ -depth -print0 | cpio --null -o > ../lpicpio.2
4 blocks

Если вы хотите, чтобы на экране отображались имена архивируемых файлов, то используйте опцию -v команды cpio.

Команда cpio в режиме copy-in (опция -i или --extract) может выводить содержимое архива или извлекать выбранные файлы. При выводе содержимого архива некоторые старые версии cpio убирают начальный символ / из каждого имени (если оно содержит его) и выводят соответствующее сообщение. Чтобы избавиться от этих посторонних сообщений при просмотре содержимого архива, вы можете указать опцию --absolute-filenames. Эта опция незаметно игнорируется во многих текущих реализациях. В листинге 35 показан выборочный вывод содержимого наших двух предыдущих архивов.

Листинг 35. Просмотр и извлечение выбранных файлов с помощью cpio
[ian@echidna lpi103-2]$ cpio  -i --list  "*backup*" < ../lpicpio.1
backup
backup/text1.bkp.1
backup/text1.bkp.2
3 blocks
[ian@echidna lpi103-2]$ cpio  -i --list absolute-filenames "*text1*" < ../lpicpio.2
/home/ian/lpi103-2/text10
/home/ian/lpi103-2/backup/text1.bkp.1
/home/ian/lpi103-2/backup/text1.bkp.2
/home/ian/lpi103-2/text1
4 blocks

В листинге 36 показано, как извлечь все файлы, содержащие в имени "text1", вместе с их путями во временную директорию. Некоторые из этих файлов расположены в поддиректориях. В отличие от tar, вам необходимо явно указать опцию -d или --make-directories в том случае, если дерево директорий не существует. Кроме того, команда cpio не замещает существующие файлы с более поздней датой, если не указана опция -u или --unconditional.

Листинг 36. Извлечение выбранных фалов с помощью cpio
[ian@echidna lpi103-2]$ mkdir temp
[ian@echidna lpi103-2]$ cd temp
[ian@echidna temp]$ cpio  -idv "*f1*" "*.bkp.1" < ../../lpicpio.1
f1a
f1
backup/text1.bkp.1
3 blocks
[ian@echidna temp]$ cpio  -idv "*.bkp.1" < ../../lpicpio.1
cpio: backup/text1.bkp.1 not created: newer or same age version exists
backup/text1.bkp.1
3 blocks
[ian@echidna temp]$ cpio  -id --no-absolute-filenames "*text1*" < ../../lpicpio.2
cpio: Removing leading `/' from member names
4 blocks
./home/ian/lpi103-2/backup/text1.bkp.1
./home/ian/lpi103-2/backup/text1.bkp.2
./home/ian/lpi103-2/text1
./backup/text1.bkp.1
[ian@echidna temp]$ cd ..
[ian@echidna lpi103-2]$ rm -rf temp # You may remove these after you have finished

Для получения дополнительной информации о различных опциях обратитесь к man-странице.

Команда dd

В простейшем случае команда dd копирует исходный файл в новый файл. Так как вы уже знакомы с командой cp, вы можете поинтересоваться, для чего нужна еще одна команда, копирующая файлы? Дело в том, что команда dd может выполнять ряд действий, которые не может выполнять обычная команда cp. В частности, она может выполнять преобразования над файлами, такие как перевод из нижнего регистра в верхний или перевод из кодировки ASCII в кодировку EBCDIC. Также она может работать с блоками файлов, что может оказаться полезным при переносе файла на ленточное устройство. Эта команда может пропускать или использовать только выбранные блоки файла. И, наконец, она может читать и записывать на raw-устройства, такие как /dev/sda, что позволяет создавать или восстанавливать файл, являющийся образом целого раздела. Как правило, для записи на устройства необходимо обладать привилегиями пользователя root.

Мы начнем с простого примера, в котором выполняется перевод текстового файла в верхний регистр с помощью опции conv, как показано в листинге 37. С помощью опции if мы указываем, что входные данные должны браться из файла, а не со стандартного устройства ввода. Существует аналогичная опция of, которая переопределяет стандартное устройство вывода, используемое по умолчанию. Для демонстрации возможностей программы мы указываем различные размеры входных и выходных блоков с помощью опций ibs и obs. В случае работы с большими файлами может оказаться удобным использовать блоки большего размера для ускорения операций по передаче данных с диска на диск. В остальных случаях размеры блоков в основном используются для работы с магнитными лентами. Обратите внимание на три строки статуса в конце листинга, которые показывают, сколько целых и частичных блоков было прочитано и записано, а также итоговый размер переданных данных.

Листинг 37. Перевод текста в верхний регистр с помощью dd
[ian@echidna lpi103-2]$ cat text6
1 apple
2 pear
3 banana
9       plum
3       banana
10      apple
1 apple
2 pear
3 banana
9       plum
3       banana
10      apple
[ian@echidna lpi103-2]$ dd if=text6 conv=ucase ibs=20 obs=30
1 APPLE
2 PEAR
3 BANANA
9       PLUM
3       BANANA
10      APPLE
1 APPLE
2 PEAR
3 BANANA
9       PLUM
3       BANANA
10      APPLE
4+1 records in
3+1 records out
98 bytes (98 B) copied, 0.00210768 s, 46.5 kB/s

Любой из файлов может являться raw-устройством. Обычно так происходит в случае с магнитной лентой, однако в файл или на ленту может быть помещена резервная копия всего дискового раздела, например /dev/hda1 или /dev/sda2. В идеальном случае файловая система устройства должна быть демонтирована или, по крайней мере, смонтирована в режиме только для чтения – это позволит гарантировать, что данные не изменятся за время создания их архивной копии. В примере листинга 38 входной файл является raw-устройством dev/sda2, а результирующий файл – обычным файлом backup-1, расположенным в домашней директории пользователя root. Чтобы создать дамп файла на ленте или другом сменном носителе, необходимо использовать опции наподобие of=/dev/fd0 или of=/dev/st0.

Листинг 38. Создание резервной копии раздела с помощью dd
[root@echidna ~]# dd if=/dev/sda2 of=backup-1
1558305+0 records in
1558305+0 records out
797852160 bytes (798 MB) copied, 24.471 s, 32.6 MB/s

Заметьте, что было скопировано 797,852,160 байтов данных, и результирующий файл действительно имеет такой размер, хотя дисковое пространство этого раздела используется всего на 3%. Если вы не используете аппаратное сжатие при копировании на ленту, возможно вам потребуется сжать данные. В листинге 39 показано, как сделать это; команды ls и df позволяют оценить размеры файлов и процент использования файловой системы на устройстве/dev/sda2.

Листинг 39. Создание резервной копии с использованием сжатия с помощью dd
[root@echidna ~]# dd if=/dev/sda2 |gzip >backup-2
1558305+0 records in
1558305+0 records out
797852160 bytes (798 MB) copied, 23.4617 s, 34.0 MB/s
[root@echidna ~]# ls -l backup-[12]
-rw-r--r--. 1 root root 797852160 2009-09-25 17:13 backup-1
-rw-r--r--. 1 root root    995223 2009-09-25 17:14 backup-2
[root@echidna ~]# df -h /dev/sda2
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda2             755M   18M  700M   3% /grubfile

Сжатие с помощью gzip уменьшает размер файла примерно на 20%. Тем не менее, неиспользуемые блоки могут содержать произвольные данные, поэтому даже сжатый архив может иметь больший размер, чем общий размер данных в разделе.

Если вы разделите общее количество скопированных байтов на количество обработанных записей, то вы увидите, что dd записывает данные в виде блоков по 512 байтов. Если копирование осуществляется на raw-устройство, такое как лента, то скорость копирования может существенно снизиться. Как упоминалось ранее, для изменения размера выходного блока можно использовать опцию obs, а для изменения размера входного блока – опцию ibs. С помощью опции bs можно задать общий размер как для входного, так и для входного блока. Если вы используете ленточный накопитель, то не забудьте использовать при чтении с ленты те же размеры блоков, что и для записи на ленту.

Если для хранения архивов необходимо использовать несколько ленточных кассет или других сменных носителей, то может потребоваться разбить архив на несколько более мелких частей с помощью такой утилиты как split. Если вам необходимо пропустить такие блоки, как метки диска или ленты, то вы можете сделать это с помощью dd. Примеры вы можете найти на man-страницах.

Команда dd не ориентирована на работу с файловой системой, поэтому если вы хотите узнать, какие данные содержатся в разделе, необходимо восстановить его дамп. В листинге 40 показано, как восстановить раздел из дампа, созданного в листинге 39, в раздел /dev/sdc7, который был специально создан для нашего примера на сменном USB-накопителе.

Листинг 40. Восстановление раздела с помощью dd
[root@echidna ~]# gunzip backup-2 -c | dd  of=/dev/sdc7
1558305+0 records in
1558305+0 records out
797852160 bytes (798 MB) copied, 30.624 s, 26.1 MB/s

Вам может быть интересно узнать, что некоторые программы для записи компакт- и DVD-дисков скрыто используют команду dd для непосредственной записи данных на устройство. Если ваша программа записывает все выполняемые действия в журнал, то теперь, когда вы немного знаете о dd, вам будет полезно просмотреть его. Если вы записываете ISO-образ на компакт- или DVD-диск, то один из способов убедиться, что в процессе записи не возникло никаких ошибок – это прочитать данные с диска при помощи dd и передать результаты на вход команде cmp. В листинге 41 показан общий подход, в котором вместо ISO-образа используется наш файл архива, созданный ранее. Обратите внимание на то, что мы подсчитываем количество блоков, которые должны быть прочитаны, на основании размера образа.

Листинг 41. Сравнение образа с файловой системой
[root@echidna ~]# ls -l backup-1
-rw-r--r--. 1 root root 797852160 2009-09-25 17:13 backup-1
[root@echidna ~]# echo $(( 797852160 / 512 )) # calculate number of 512 byte blocks
1558305
[root@echidna ~]# dd if=/dev/sdc7 bs=512 count=1558305 | cmp - backup-1
1558305+0 records in
1558305+0 records out
797852160 bytes (798 MB) copied, 26.7942 s, 29.8 MB/s

Ресурсы

Комментарии

developerWorks: Войти

Обязательные поля отмечены звездочкой (*).


Нужен IBM ID?
Забыли Ваш IBM ID?


Забыли Ваш пароль?
Изменить пароль

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Профиль создается, когда вы первый раз заходите в developerWorks. Информация в вашем профиле (имя, страна / регион, название компании) отображается для всех пользователей и будет сопровождать любой опубликованный вами контент пока вы специально не укажите скрыть название вашей компании. Вы можете обновить ваш IBM аккаунт в любое время.

Вся введенная информация защищена.

Выберите имя, которое будет отображаться на экране



При первом входе в developerWorks для Вас будет создан профиль и Вам нужно будет выбрать Отображаемое имя. Оно будет выводиться рядом с контентом, опубликованным Вами в developerWorks.

Отображаемое имя должно иметь длину от 3 символов до 31 символа. Ваше Имя в системе должно быть уникальным. В качестве имени по соображениям приватности нельзя использовать контактный e-mail.

Обязательные поля отмечены звездочкой (*).

(Отображаемое имя должно иметь длину от 3 символов до 31 символа.)

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Вся введенная информация защищена.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=40
Zone=Linux
ArticleID=757838
ArticleTitle=Изучаем Linux, 101: Управление файлами и директориями
publish-date=09152011