Немного о хранении информации

Эта статья расскажет Вам о существующих типах жестких дисков, и технологиях используемых с ними.

Жесткие диски разделяются по типу интерфейса, который они используют. Для домашних компьютеров это интерфейсы ATA и SATA.

Жесткие диски с интерфейсом ATA — Advanced Technology Attachment прижились с маркетинговым названием IDE — Integrated Drive Electronics, впоследствии EIDE — Enhanced IDE. 

Выглядит этот интерфейс так:

ide_hdd

ata

 

Для передачи данных используется параллельный интерфейс, в связи с чем после появления интерфейса SATA — serial ata, интерфейс, а также кабели к нему стали называть PATA — parallel ata.

Если вдруг Вам в руки попадется старый IDE диск и Вам нужно скопировать с него данные, но под рукой нет материнской платы с нужным интерфейсом — не беда. Можно купить так называемую док станцию для жестких дисков, в неё вставляется жесткий диск, а док станция подключается к компьютеру по USB.

doc_station

С увеличением объемов передаваемых данных, требовалось увеличивать пропускную способность интерфейса.

Проблема параллельного интерфейса в том, что данные передаются по шине параллельно, и на другом конце возникает проблема рассхинхронизации потока данных, в связи с этим стали использовать последовательную шину — биты пересылаются последовательно один за другим. Таким интерфейсом стал SATA — последовательный интерфейс обмена данными.

sata_cable

The SATA connectors of a Vertex 2 Solid State Drive (SSD) by OCZ

Сейчас это основной стандарт для подключения жестких дисков в компьютерах.

В данный момент стандарт SATA существует в трех ревизиях:

  • SATA Revision 1.0 (до 1,5 Гбит/с, или около 150 Мбайт/c)
  • SATA Revision 2.0 (до 3 Гбит/с, или около 300 Мбайт/c)
  • SATA Revision 3.0 (до 6 Гбит/с, или около 600 Мбайт/c)

Полностью реализовать потенциал SATA-3 может только твердотельный жесткий диск — SSD. Диски же на магнитных пластинах с интерфейсом SATA-3 это больше маркетинговый ход, так как реализовать подобную скорость они не смогут в силу своих конструктивных особенностей.

Например  диск  WD Raptor, со скоростью вращения шпинделя 10 000 оборотов в минуту (у обычных дисков 5400 или 7200) выдаёт скорость около 200 Мбайт в секунду (в идеальных условиях), что как мы видим даже не достигает пика SATA-2.

Следующий интерфейс eSATA — External SATA. Используется для подключения внешних устройств, не совместимы с обычным SATA. Например внешний HDD.

esata_hdd esata

В серверных же решениях использовались диски с интерфейсов SCSI — Small Computer System Interface. Параллельный интерфейс, который в настоящее время почти не используется.

scsi

На смену ему пришел интерфейс SAS — Serial Attached SCSI. По внешнему виду он очень напоминает SATA, и SATA диски второй и третьей ревизии можно подключать к контроллеру SAS, а вот подключить диск с интерфейсом SAS к SATA уже не получится. Интерфейс SAS работает на скорости до 12Гбит/с.

sas

Теперь поговорим об организации хранения данных в серверах. Существует несколько технологий подключения дисков.

Первая и самая простая называется DAS — Direct-attached storage. Она означает что сервер использует диски непосредственно подключенные к серверу.

server_das

Далее идёт NAS — Network Attached Storage. Он представляет собой набор дисков, на отдельностоящем сервере, предоставляющий доступ к файлам на основе какого-либо высокоуровневого протокола, например SMB или NFS. То есть на сервере с дисками уже должна быть какая-то файловая система, к которой предоставлен доступ.

Типичный пример — домашний файловый сервер.

nas_server

На крупных предприятиях используются сети хранения данных СХД или SAN — Storage Area Network.

Основное отличие от NAS и DAS в том, что сеть SAN предоставляет блочный доступ к данным, и нам не нужна файловая система для доступа.

Локальный сервер, которому мы презентуем ресурсы с СХД по оптоволокну (Fibre Channel) или по ethernet (iSCSI) будет видеть презентованную ему часть диска как свой собственный локальный диск. Все операции будут выполняться абсолютно прозрачно. Называется часть презентуемого диска LUN — Logical Unit Number.

Выглядит это следующим образом. У нас есть некий дисковый массив, c FC портами или Ethernet. На этом массиве создаётся RAID нужного нам уровня, например уровень 1+0, или 10, что одно и тоже. На этом RAID мы нарезаем нужные нам по размеру LUN и презентуем серверам, на которых мы разместим базы данных, файловое хранилище, или что либо еще. В итоге получаем отказоустойчивость и масштабируемость.

В RAID массивах могут использоваться так называемые Hot Spare — это диски вставленные в хранилище, но не используемые в данный момент. При выходе из строя какого-либо из дисков, контроллер автоматически подменяет плохой диск на диск из Hot Spare — горячего резерва.

SATA и SAS поддерживают Hot Swap — горячую замену, то есть без выключения компьютера можно подключать и отключать диски. Не системные конечно)

И напоследок уровни RAID:

Уровень 0 (stripe) — Не обеспечивает отказоустойчивости, объем дискового пространства равняется ёмкости всех дисков, получаем выигрыш в скорости чтения и записи.

Уровень 1 (mirror) — Зеркало. Обеспечивает отказоустойчивость при одного диска из зеркала. Объем — половина от общей ёмкости дисков.

Уровень 5 (parity) — Минимум три диска. Контроль чётности. Объем составляет ёмкость всех дисков минус один. Медленный для записи, быстрый для чтения.

Уровень 10 — Это два массива RAID 1 собранные в RAID 0. На выходе имеем производительность RAID 0 и отказоустойчивость RAID 1. Минусы — объём дискового пространства равен половине всех дисков в массиве.

Если у Вас есть вопросы, задавайте их на форуме, или ниже в комментариях.

Пока нет комментариев

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Реклама

Реклама

Tags