【学习笔记】Linux系统存储结构

prostar · 发表于 2016-3-13 16:26:06

linux存储模式
五层：

应用程序    cp

虚拟文件系统 VFS　　　挂载

文件系统格式化

设备驱动  ext4.so

物理卷    dd

物理卷：
如硬盘或分区：
硬盘接口:
IDE,SATA，SCSI，SAS；

设备驱动:
要使用对应的文件系统需要对应的模块。
如ext4
lsmod |grep ext4
如ntfs
linux内核支持，但redhat内核没有加上对应的功能
解决方法:
1,重编内核，加上ntfs支持
2,用第三方软件(如ntfs-3g)，加上此功能

文件系统:
有对应的驱动模块，就可以格式化成对应的文件系统
如
mkfs.ext4  /dev/sdax

虚拟文件系统层(VFS)：
先提一个问题:我能不在把ext4文件系统里的一个文件cp到ntfs文件系统里呢?
答案:可以.
那么也就是说开发人员开发一个cp命令要支持所有的文件系统，如果出现一个新的文件系统，开发人员需要去修改cp命令的源代码。这样效率低下。
实际情况是:cp命令源代码不需要修改，就是因为有虚拟文件系统层（VFS）。

应用层:
在文件系统上任何操作的命令都是应用层,如ls,cp,mv等

===============================================================

dd - convert and copy a file

msdos 446+64(分区表)+2=512  MBR
gpt

1，备份mbr(master boot record主引导记录)
dd if=/dev/sda of=/backup/mbr.backup  bs=1  count=512
删除mbr  dd if=/dev/zero  of=/dev/sda bs=1 count=512
就会发现fdisk -l 看不到分区，一重启系统就启不来了
恢复：dd if=/backup/mbr.backup  of=/dev/sda
2,备份整个硬盘
dd if=/dev/sda of=/dev/sdb  --把/dev/sda的数据备份到/dev/sdb
      恢复：dd if=/dev/sdb of=/dev/sda
dd if=/dev/sda of=/backup/full.backup  --把/dev/sda的数据备份成一个文件
      恢复：dd if=/backup/full.backup of=/dev/sda
3,备份软盘
dd if=/dev/fd0 of=/backup/fd0.backup  bs=1 count=1440
      恢复：dd if=/backup/fd0.backup of=/dev/fd0
4,从光盘拷贝iso镜像 (把iso镜像文件需要刻录软件如nero把它刻录到光盘）
   dd if=/dev/cdrom  of=/xxx.iso
5,从内存里拷贝资料到磁盘
   dd if=/dev/mem  of=/backup/mem.bin
特殊应用：
6，销毁磁盘数据
   dd if=/dev/urandom of=/dev/sda --随机数填充磁盘
7，修复硬盘，当硬盘长时间不使用
   dd if=/dev/sda  of=/dev/sda
8,raw设备（裸设备）或者lvm数据迁移等
--讲udev时会讲

裸设备（没有格式化成文件系统的设备，优势就是跳过文件系统层，提高性能效率）

稀疏文件

# dd if=/dev/zero of=test bs=1M count=1 seek=4000000
# ll test -h
-rw-r--r-- 1 root root 3.9T Sep 17 16:41 test
# du -s test
1024 test

# dd if=/dev/zero of=test1 bs=1M count=1 seek=17000000
dd: failed to truncate to 17825792000000 bytes in output file `test1': File too large
--在ext4下，单个文件最大大小为16T,再大的话就会报错

单个文件16T是在ext4文件系统默认的block size=4096的情况下，如果块大小为1024，那么单个文件最大大小为4T

用dd备份，干掉，恢复分区表
skip为跳过input(也就是if后接的设备)
seek为跳过output(也就是of后接的设备)

446+64+2=512       分区表447-510

1,备份分区表
dd if=/dev/sda  of=/backup/partition.bak  bs=1 count=64  skip=446

2，干掉分区表
dd if=/dev/zero of=/dev/sda bs=1 count=64 seek=446

3，恢复分区表
dd if=/backup/partition.bak of=/dev/sda bs=1 count=64 seek=446

===================================================================

gpt    没有主分区，扩展分区，逻辑扩展分区的概念，支持单个分区最大超过2TB
msdos 有主分区，扩展分区，逻辑扩展分区的概念

BIOS    (Basic input and output system)
EFI/UEFI （Extensible Firmware Interface）

P primary主分区
E extend扩展分区
L logical逻辑扩展分区

4P
3P+1E(N个L)

-----------------------------------

fdisk (只能分msdos分区)
parted (可以分msdos和gpt分区)

如何确定你现在的磁盘使用的是哪此分区类型（msdos或gpt)?
# parted /dev/sda
GNU Parted 2.1
Using /dev/sda
Welcome to GNU Parted! Type 'help' to view a list of commands.
(parted) print
Model: ATA ST3500312CS (scsi)
Disk /dev/sda: 500GB
Sector size (logical/physical): 512B/512B
Partition Table: msdos    --这里就可以看到类型

这两种分区格式怎么转换?
(parted) mklabel gpt       --在parted里输入这样的命令去转换
Warning: Partition(s) on /dev/sda are being used.
Ignore/Cancel?          --宿主机千W不要输入Ignore（表示忽略警告，直接干掉系统磁盘里的所有内容)，输入Cancel取消或者ctrl+c取消
(parted) mklabel msdos

--注意，不要在正在使用磁盘时做转换(当然你如果不需要当前硬盘的数据的话，也可以直接对使用磁盘做转换），如果你要做转换可以在以下几种情况去做(先备份数据）
1，rescue模式
2，把磁盘接到另一台linux，另一台启动并使用parted /dev/sdb来做转换
3，对一个新加的还未使用的硬盘可以直接做转换
4，在安装系统时，在分区那一步，可以按ctrl+alt+F2切换(vmware这么做，如果是kvm，按图形界面上面的sendkey里选择ctrl+alt+F2)到文本模式，再使用parted来转换

(parted) help
(parted) mkpart
Partition type?  [logical]?    --因为我现在是msdoc分区，所以才会有此选项;gpt分区无此选项
File system type?  [ext2]? ext4  --这是标识此分区的格式化类型，但其它可以随便写的，以你最终格式化的格式为主
Start? 278GB
End? 279GB
(parted) quit

# ls /dev/sda16       --刚分完的区，我这里用ls查不到设备文件，那么就无法对其格式化
ls: cannot access /dev/sda16: No such file or directory

# partx -a /dev/sda --使用此命令（注意后面接的是硬盘名，不是分区名）
# ls /dev/sda16    --能看到此设备名就表示OK了（特殊情况如果还不能看到设备名，则需要reboot你的操作系统）
/dev/sda16

能看到设备后，就可以格式化挂载使用了

======================================================================

硬件存储－－》硬raid－－》通过iscsi或光纤网络共享给服务器－－》分区（lvm可选)－－》格式化－－》mount使用

raid    redundant  arrays of  inexpensive disks
简单来说，raid就是把多个磁盘组成一个磁盘组（为了提高IO性能和数据高可用）

硬raid 　生产环境用这个，使用raid卡来做的磁盘阵列
软raid 　使用软件做的磁盘阵列，实现应用没什么价值，这里用于教学说明原理

raid级别
常见的raid5,raid10

raid  0 读写性能佳，坏了其中一块，数据挂掉，可靠性低（stripe条带化），磁盘利用率100％

         A B

            1234
         1 2
         3 4

raid  1 镜像备份（mirror)，同一份资料完整的保存在多个磁盘上，写的性能不佳，可靠性高，读的性能还行，磁盘利用率50%

         A B
            1234
         1 1
         2 2
         3 3
         4 4

raid 10 先做raid 1 再做raid 0

            abc

      disk 0 disk 1       raid 1
      a       a
      disk 2    disk 3       raid 1
      b       b
      disk 4 disk 5       raid 1
      c       c

坏掉disk 0后：
         读写性
   另外五块都可以读写
   安全性：
   另五块中，只有坏掉disk 1 整个raid才会挂掉，概率为1/5

raid 01 先做raid 0 再做raid 1

      abc       abc
      raid 0    raid 0

      disk 0 disk 3
      a       a
      disk 1    disk 4
      b       b
      disk 2 disk 5
      c       c

坏掉disk 0后：
读写性：
      还有三块可以读写
安全性：
      另外五块中3,4,5坏掉任意一块，则整个raid挂掉。概率为3/5

raid 10和  raid01就安全可靠性上来说还是raid10好点，读写性能一样，磁盘利用率一样

raid  5

由多块磁盘做raid 5，磁盘利用率为n-1/n,  其中一块放校验数据，允许坏一块盘，数据可以利用校验值来恢复

         disk 1       disk 2       disk 3

         数据       数据       校验
         检验       数据       数据
         数据       检验       数据

raid 5 和  raid 10

3d + 1       2d+2d

1,利用率（成本)
3/4       1/2

2,安全性
坏掉一块的情况，raid5就不能再坏了
      raid10只有当和坏掉的那块同为raid1组里的时候，才会整个坏掉，概率1/3

3,读写性能
raid 5对大文件读写好点 olap（联机分析处理)
raid 10对小文件读写好点 oltp(联机事务处理)

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

使用vmware或者kvm直接在线加9个1G大小的硬盘

linear 线型
stripe  条带
mirror 镜像

   mdadm  - manage MD devices aka Linux Software
   RAID

创建raid 0
[root@raid ~]# mdadm --create /dev/md0 --level=0 --raid-devices=2 /dev/sdb /dev/sdc
mdadm: array /dev/md0 started.

创建过程中可以用另一终端cat /proc/mdstat  去查看正在创建的状态信息

[root@raid ~]# mkfs.ext4 /dev/md0

[root@raid ~]# mount /dev/md0 /mnt/

[root@raid ~]# df -h |grep mnt
/dev/md0             2.0G 36M  1.9G 2% /mnt

[root@raid ~]# cat /proc/mdstat
Personalities : [raid0]
md0 : active raid0 sdc[1] sdb[0]
   2097024 blocks 64k chunks

unused devices: <none>

创建raid 1
[root@raid ~]# mdadm --create /dev/md1 --level=1 --raid-devices=2 /dev/sdd /dev/sde
mdadm: array /dev/md1 started.

[root@raid ~]# mkfs.ext4 /dev/md1

[root@raid ~]# mount /dev/md1 /media/

[root@raid ~]# df -h |grep md
/dev/md0             2.0G 36M  1.9G 2% /mnt
/dev/md1          1008M 18M  940M 2% /media

创建raid5
[root@raid ~]# mdadm --create /dev/md5 --level=5 --raid-devices=4 /dev/sdf /dev/sdg /dev/sdh /dev/sdi
mdadm: array /dev/md5 started.

[root@raid ~]# watch cat /proc/mdstat  --这里监控一下它们盘之间的数据同步；等它们同步完毕再进行下面的格式化

[root@raid ~]# mkfs.ext4 /dev/md5

[root@raid ~]# mount /dev/md5 /misc/

[root@raid ~]# df -h |grep md
/dev/md0             2.0G 36M  1.9G 2% /mnt --raid 0利用率为100%
/dev/md1          1008M 18M  940M 2% /media --raid 1利用率为50%
/dev/md5             3.0G 69M  2.8G 3% /misc --raid 5利用率为n-1/n,在这里就是3/4

--验证raid0
在做raid0的两个盘上查看io情况
例:
终端1：iostat 2 两秒一次查看所有的盘上的IO情况
终端2: dd if=/dev/zero of=/mnt/aaa bs=1M count=1000

可以看到两个盘上都有写的io,并且/dev/sdb和/dev/sdc的IO一样,总和才等于/dev/md0的IO;验证了raid0的功能(条带)

--验证raid1
在做raid1的两个盘上查看io情况
例:
终端1：iostat 2 两秒一次查看所有的盘上的IO情况
终端2: dd if=/dev/zero of=/media/aaa bs=1M count=1000

可以看到两个盘上都有写的io,并且/dev/sdd和/dev/sde的IO一样,并且也等于/dev/md1的IO;验证了raid1的功能(镜像)

--验证raid5
在做raid5的四个盘上查看io情况
例:
终端1：iostat 2 两秒一次查看所有的盘上的IO情况
终端2: dd if=/dev/zero of=/misc/aaa bs=1M count=1000

可以看到四个盘上都有写的io,并且/dev/sdf,/dev/sdg,/dev/sdh,/dev/sdi四个盘的IO总和为/dev/md5的IO的4/3;验证了raid5的功能(n-1/n)

实际速度比较应该为:raid0>raid5>raid1或不做raid

===========================================================

--raid的启停

[root@raid ~]# vim /etc/mdadm.conf --手动编写raid的配置文件，此文件不存在，要手动建立，并写上
DEVICES /dev/sdb /dev/sdc /dev/sdd /dev/sde /dev/sdf /dev/
sdg /dev/sdh /dev/sdi --把做了raid的分区写上来。或者写成DEVICES /dev/sd[bcdefghi]。但不能写成DEVICES /dev/sd{b,c,d,e,f,g,h,i}

[root@raid ~]# mdadm --detail --scan >> /etc/mdadm.conf
            --扫描当前raid的信息，并追加到配置文件里

# cat /etc/mdadm.conf
DEVICES /dev/sdb /dev/sdc /dev/sdd /dev/sde /dev/sdf /dev/sdg /dev/sdh /dev/sdi
ARRAY /dev/md0 level=raid0 num-devices=2 metadata=0.90 UUID=84209045:9c03c4cb:7f755b8d:cc471294
ARRAY /dev/md1 level=raid1 num-devices=2 metadata=0.90 UUID=4e62fdc1:6c2a652f:fb72c05d:356d5c76
ARRAY /dev/md5 level=raid5 num-devices=4 metadata=0.90 UUID=c3c1f37b:9fba8a89:a711dc6c:01a5ddb3

--如果你不做上面这步，重启系统，raid会不能自动被认到（在rhel6里测试为重启后名字会变）。所以做完的raid都需要扫描并存放信息

停止raid设备

先umount 已经挂载的raid设备
[root@raid ~]# umount /mnt/
[root@raid ~]# umount /media/
[root@raid ~]# umount /misc/

然后使用命令停止
[root@raid ~]# mdadm --stop /dev/md0
mdadm: stopped /dev/md0
[root@raid ~]# mdadm --stop /dev/md1
mdadm: stopped /dev/md1
[root@raid ~]# mdadm --stop /dev/md5
mdadm: stopped /dev/md5

启动raid设备
1，有/etc/mdadm.conf配置文件的情况下
[root@raid ~]# mdadm -A /dev/md0
mdadm: /dev/md0 has been started with 2 drives.
[root@raid ~]# mdadm -A /dev/md1
mdadm: /dev/md1 has been started with 2 drives.
[root@raid ~]# mdadm -A /dev/md5
mdadm: /dev/md5 has been started with 4 drives.

[root@raid ~]# cat /proc/mdstat  --再查看，就有信息了，并且raid里的数据还在

2，没有配置文件的情况下，手动把设备名写上就可以了
[root@raid ~]# mdadm -A /dev/md0  /dev/sd{b,c}
mdadm: /dev/md0 has been started with 2 drives.

[root@raid ~]# mdadm -A /dev/md1  /dev/sd{d,e}
mdadm: /dev/md1 has been started with 2 drives.

[root@raid ~]# mdadm -A /dev/md5  /dev/sd{f,g,h,i}
mdadm: /dev/md5 has been started with 4 drives.

3，如果连设备名都不知道，可以去查看每个设备的raid信息，使用uuid把raid设备重新组合
[root@raid ~]# mdadm -E /dev/sdf
/dev/sdf:
      Magic : a92b4efc
      Version : 0.90.00
         UUID : b091e16b:f8df9671:465755db:c640595b --UUID,同一个raid里每个磁盘查看的都是这个值
  Creation Time : Sat May  7 11:23:52 2011
   Raid Level : raid5
  Used Dev Size : 1048512 (1024.11 MiB 1073.68 MB)
   Array Size : 3145536 (3.00 GiB 3.22 GB)
Raid Devices : 4
  Total Devices : 4
Preferred Minor : 5

Update Time : Sat May  7 11:42:09 2011
      State : clean
Active Devices : 4
Working Devices : 4
Failed Devices : 0
  Spare Devices : 0
   Checksum : facef367 - correct
      Events : 2

      Layout : left-symmetric
   Chunk Size : 64K

   Number Major Minor RaidDevice State
this    0    8    80       0    active sync /dev/sdf

0    0    8    80       0    active sync /dev/sdf
1    1    8    96       1    active sync /dev/sdg
2    2    8    112       2    active sync /dev/sdh
3    3    8    128       3    active sync /dev/sdi

[root@raid ~]# mdadm -A --uuid=b091e16b:f8df9671:465755db:c640595b /dev/md5
mdadm: /dev/md5 has been started with 4 drives.

--上面组合后的名字可以随意写，甚至是不存在的一个名字，相当于是重新组合

=================================================================

软raid的热插拔实验

模拟raid中其中一块盘故障
[root@raid ~]# mdadm /dev/md5 --fail /dev/sdf
mdadm: set /dev/sdf faulty in /dev/md5
--使用--fail对raid中其中一块盘打一个fail标记

[root@raid ~]# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid6] [raid5] [raid4]
md5 : active raid5 sdf[4](F) sdi[3] sdh[2] sdg[1]--有个F标记
   3145536 blocks level 5, 64k chunk, algorithm 2 [4/3] [_UUU]

md1 : active raid1 sdd[0] sde[1]
   1048512 blocks [2/2] [UU]

md0 : active raid0 sdb[0] sdc[1]
   2097024 blocks 64k chunks

[root@raid ~]# mdadm /dev/md5 --remove /dev/sdf
mdadm: hot removed /dev/sdf
--热移除故障磁盘

[root@raid ~]# mdadm /dev/md5 --add /dev/sdj  --增加一块新的磁盘上去
mdadm: re-added /dev/sdj
--刚增加完后，机器负载较高，因为现在它在对新盘同步数据

[root@raid ~]# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid6] [raid5] [raid4]
md5 : active raid5 sdj[4] sdi[3] sdh[2] sdg[1]
   3145536 blocks level 5, 64k chunk, algorithm 2 [4/3] [_UUU]
   [=====>...............]  recovery = 29.2% (307840/1048512) finish=0.0min speed=153920K/sec --这里可以看到在同步中

md1 : active raid1 sdd[0] sde[1]
   1048512 blocks [2/2] [UU]

md0 : active raid0 sdb[0] sdc[1]
   2097024 blocks 64k chunks

--同步完成后，查看数据还在

－－－－－－－－－－－－－－－－－－－－－

把raid设备挂载到/mnt目录
# mysql_install_db --datadir=/mnt --user=mysql
# mysqld_safe --datadir=/mnt/ --user=mysql &

然后使用mysql进入，插入一些数据，再进行热插拔实验，在这个过程中都可以进入大批量insert操作，不受影响（只受负载影响，因为同步raid数据时也要占用负载）

=================================================================

删除raid

1,umount

2,
[root@raid ~]# mdadm /dev/md5 --fail /dev/sdf --remove /dev/sdf
mdadm: set /dev/sdf faulty in /dev/md5
mdadm: hot removed /dev/sdf
[root@raid ~]# mdadm /dev/md5 --fail /dev/sdg --remove /dev/sdg
mdadm: set /dev/sdg faulty in /dev/md5
mdadm: hot removed /dev/sdg
[root@raid ~]# mdadm /dev/md5 --fail /dev/sdh --remove /dev/sdh
mdadm: set /dev/sdh faulty in /dev/md5
mdadm: hot removed /dev/sdh
[root@raid ~]# mdadm /dev/md5 --fail /dev/sdi --remove /dev/sdi
mdadm: set /dev/sdi faulty in /dev/md5
mdadm: hot removed /dev/sdi

3,
[root@raid ~]# mdadm --stop /dev/md5
mdadm: stopped /dev/md5

4,
直接用fdisk删除分区
或者
用下面命令擦除superblock
[root@raid ~]# mdadm --misc --zero-superblock /dev/sdf
[root@raid ~]# mdadm --misc --zero-superblock /dev/sdg
[root@raid ~]# mdadm --misc --zero-superblock /dev/sdh
[root@raid ~]# mdadm --misc --zero-superblock /dev/sdi

--把上面的四个盘再做成raid 10

方法一:
# mdadm --create /dev/md10 --level=10 --raid-devices=4 /dev/sd[fghi]

方法二：
先把两个做成两组raid1
再把这两组做成raid0

--做完raid10后把配置文件/etc/mdadm.conf里的raid信息的那几行删除，再重新用下面的命令扫描一下
mdadm --detail --scan >> /etc/mdadm.conf

===================================================================

docs.redhat.com

LVM 逻辑卷管理 logical volume manager

--参考下面的文档
# ls /share/soft/soft/pdf/redhat_5_zh/Red_Hat_Enterprise_Linux-5-Cluster_Logical_Volume_Manager-zh-CN.pdf

pv physical volume(物理卷）把实际分区或设备划为pv ，  pv是lvm物理标记

vg volume group (卷组）把pv组合成vg，相当于组合成lvm能够使用一个大硬盘

lv logical  volume (逻辑卷）  实际可以使用的lvm的设备，相当是把vg划分成可用的分区

pe physical extend (物理扩展）vg组成的最小单位，默认是4M，vg最大支持65535个pe,相当于是block

block devices －－＞ PV －－＞  VG －－＞ LV (线型，条带，镜像)  －－＞格式化  －－－＞挂载使用

做成lvm的优势:
1,可以灵活变动大小
2,可以自定义设备名(物理卷也可以改名，使用udev）
3,可以做线型(linear),条带(stripe),镜像(mirror)
4,可以做lvm快照

1，划分pv
[root@raid ~]# pvcreate /dev/md0
  Physical volume "/dev/md0" successfully created
[root@raid ~]# pvcreate /dev/md1
  Physical volume "/dev/md1" successfully created
[root@raid ~]# pvcreate /dev/md10
  Physical volume "/dev/md10" successfully created

查看相关信息的命令 pvscan  pvdisplay  pvs

删除pv的命令  pvremove /dev/md10

[root@raid ~]# pv
pvchange pvcreate pvmove    pvresize pvscan
pvck    pvdisplay  pvremove pvs       pv.sh

2,划分vg

[root@raid ~]# vgcreate vg01 /dev/md10
  Volume group "vg01" successfully created
[root@raid ~]# vgextend vg01 /dev/md0
  Volume group "vg01" successfully extended
[root@raid ~]# vgextend vg01 /dev/md1
  Volume group "vg01" successfully extended

--补充：vgcreate -s  指定PE的大小

查看相关信息的命令vgscan vgdisplay vgs

# vgs
  VG #PV #LV #SN Attr VSize VFree
  vg01 3 0 0 wz--n- 4.99G 4.99G

[root@raid ~]# vgreduce vg01 /dev/md0
  Removed "/dev/md0" from volume group "vg01"
--vgreduce跟vgextend是相反的，是在vg里移除pv

移除vg的命令是vgremove，它是和vgcreate相反

3,把vg划分为逻辑卷(线性卷linear)

[root@raid ~]# lvcreate -L 1000M -n lv01 vg01 --L指定大小，n指定lv的名字
  Logical volume "lv01" created

[root@raid ~]# lvcreate -l 250 -n lv02 vg01 --l指定PE的个数，n指定lv的名字
  Logical volume "lv02" created

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

[root@raid ~]# lvcreate -L 1001M -n lv03 vg01 --指定为1001M，它会自动做成1004M，要是PE的倍数
  Rounding up size to full physical extent 1004.00 MB
  Logical volume "lv03" created

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

[root@raid ~]# ls /dev/vg01/ -l
lrwxrwxrwx 1 root root 21 May  7 14:14 lv01 -> /dev/mapper/vg01-lv01
lrwxrwxrwx 1 root root 21 May  7 14:15 lv02 -> /dev/mapper/vg01-lv02

[root@raid ~]# ls /dev/mapper/ -l
brw-rw---- 1 root disk 253,  0 May  7 14:14 vg01-lv01
brw-rw---- 1 root disk 253,  1 May  7 14:15 vg01-lv02

[root@raid ~]# mkfs.ext4  /dev/vg01/lv01

[root@raid ~]# mkfs.ext4  /dev/vg01/lv02

[root@raid ~]# mount /dev/vg01/lv01 /mnt/
[root@raid ~]# mount /dev/vg01/lv02 /media/

[root@raid ~]# df -h | tail -4
/dev/mapper/vg01-lv01
                  985M 18M  918M 2% /mnt
/dev/mapper/vg01-lv02
                  985M 18M  918M 2% /media

[root@raid ~]# echo '12345' > /mnt/1
[root@raid ~]# echo '678910' > /media/2

查看的相关参数为lvscan lvdisplay

[root@raid ~]# lvscan
  ACTIVE          '/dev/vg01/lv01' [1000.00 MB] inherit
  ACTIVE          '/dev/vg01/lv02' [1000.00 MB] inherit

移除lv使用lvremove

完全删除lvm，就要先lvremove,再vgremove，最后pvremove

=============================================================

[root@raid ~]# vgs
  VG #PV #LV #SN Attr VSize VFree
  vg01 3 2 0 wz--n- 4.99G 3.04G

[root@raid ~]# lvcreate -l 50%VG -n lv03 vg01       --创建lv03，大小为vg01的一半
[root@raid ~]# lvcreate -l 100%FREE -n lv04 vg01 --把剩下的所有空间都分配给新创建的lv04

[root@raid ~]# lvs       --使用lvs验证
  LV VG Attr LSize Origin Snap%  Move Log Copy%  Convert
  lv01 vg01 -wi-ao 1000.00M
  lv02 vg01 -wi-ao 1000.00M
  lv03 vg01 -wi-a- 2.49G
  lv04 vg01 -wi-a-  556.00M

=================================================

使用lvremove把上面的四个卷给移除，再来创建条状卷

[root@raid ~]# lvremove vg01    --移除四个卷
Do you really want to remove active logical volume lv01? [y/n]: y
  Logical volume "lv01" successfully removed
Do you really want to remove active logical volume lv02? [y/n]: y
  Logical volume "lv02" successfully removed
Do you really want to remove active logical volume lv03? [y/n]: y
  Logical volume "lv03" successfully removed
Do you really want to remove active logical volume lv04? [y/n]: y
  Logical volume "lv04" successfully removed
  Volume group "lv01" not found

当您创建条状逻辑卷时，请使用 lvcreate 命令的 -i 参数指定条带的数目。这取决于逻辑卷要进行条带
化的物理卷数目。条带的数目不能超过卷组中物理卷的数目（除非使用 --alloc anywhere 参数）

如果构成逻辑卷的基本物理设备的大小不同，条状卷的最大容量由最小的基本设备决定。例如，在有两
个分支条状卷中，其容量最大为较小设备的两倍。在有三个分支的条状卷中，其容量是最小设备的三倍
。

条带卷的大小由最小的PV和创建命令的-i参数(条带数)来决定
以这个为例
  PV       VG Fmt  Attr PSize PFree
  /dev/md0 vg01 lvm2 a--    2.00g 2.00g
  /dev/md1 vg01 lvm2 a--  1020.00m 1020.00m
  /dev/md10  vg01 lvm2 a--    2.00g 2.00g
1,因为我这有三个PV,所以用-i 3实现三个条带;那么最大大小为1020*3=3060M

--创建条带卷
# lvcreate -L 3060M -i3  -n stripe_lv_01 vg01
  Logical volume "stripe_lv_01" created

可以对其格式化，再用dd和iostat来做测试(但测试的结果比较复杂,因为我是几种不同的raid做的条带卷)

===========================================

镜像卷

当您创建一个镜像卷时，您可使用 lvcreate 命令的 -m 参数来指定数据的备份数目。指定 -m1 生成一
个镜像，也就是生成两个文件系统副本：一个线性逻辑卷加上一个副本。同样的，指定 -m2 会生成两
个镜像，也就是生成三个文件系统副本。

镜像卷的大小由最小的PV和副本数（也就是-m后接的数字)来决定
以这个为例
  PV       VG Fmt  Attr PSize PFree
  /dev/md0 vg01 lvm2 a--    2.00g 2.00g
  /dev/md1 vg01 lvm2 a--  1020.00m 1020.00m
  /dev/md10  vg01 lvm2 a--    2.00g 2.00g
1,如果-m 1，那么他会选md0和md10这两个来做镜像，所以最大大小为2G
2,如果-m 2,那么他会选这三个一起来做，最大大小为1020M
3,不能-m 3或者更大;因为我这里只有三个PV

--以下面的为例
# pvs
  PV       VG Fmt  Attr PSize PFree
  /dev/sdb13 vg01 lvm2 a- 964.00M 964.00M
  /dev/sdb14 vg01 lvm2 a- 964.00M 964.00M
  /dev/sdb15 vg01 lvm2 a- 964.00M 964.00M

# vgs
  VG #PV #LV #SN Attr VSize VFree
  vg01 3 0 0 wz--n- 2.82G 2.82G

8,再次创建镜像卷，成功创建
# lvcreate -n lv_mirror -L 300M -m 1 vg01
  Logical volume "lv_mirror" created

# ls /dev/mapper/
control       vg01-lv_mirror_mimage_0  vg01-lv_mirror_mlog
vg01-lv_mirror  vg01-lv_mirror_mimage_1

格式化这个镜像卷，并挂载
# mkfs.ext3 /dev/mapper/vg01-lv_mirror
# mount /dev/mapper/vg01-lv_mirror /media/

# df -h
/dev/mapper/vg01-lv_mirror
                  291M 11M  266M 4% /media

测试镜像卷可用性
# echo 123 > /media/123
# cat /media/123
123
破坏其中一个物理卷。
      # dd if=/dev/zero of=/dev/sdb13
      或者
      # mkfs.ext3 /dev/sdb13

pvs  检测出有物理卷被损坏,找不到uuid

但数据仍然可以正常访问
# cat /media/123
123

可以对其格式化，再用dd和iostat来做测试(但测试的结果比较复杂,因为我是几种不同的raid做的条带卷)

关于三种卷之间的转换

--把线性卷转化成镜像卷
lvconvert -m 1 vg01/lv_linear --速度较慢
--把镜像卷转化成线性卷
lvconvert -m 0 vg01/lv_mirror --速度较快

实现总结：
1，如果物理做了raid10，那么就可以不做条带和镜像卷了，只有线性卷就可以了
2，如果物理没做raid，那么你希望提高IO性能或高可用，则可以使用条带或镜像卷

============================================================

lv的扩容

1,先考虑vg是否还有空间去扩容，如果没有，那么要先扩容vg,使用vgextend

2，
[root@raid ~]# lvextend -L 1.5g /dev/vg01/lv01
  Extending logical volume lv01 to 1.50 GB
  Logical volume lv01 successfully resized

下面两种写法也可以
[root@dns ~]# lvextend -L +500M /dev/vg01/lv01
[root@dns ~]# lvextend -l +125 /dev/vg01/lv01

[root@raid ~]# df -h
/dev/mapper/vg01-lv01
                  985M 18M  918M 2% /mnt--查看已经挂载的大小，没有变化

3，
[root@raid ~]# resize2fs /dev/vg01/lv01 --再使用这个命令去在线同步
resize2fs 1.39 (29-May-2006)
Filesystem at /dev/vg01/lv01 is mounted on /mnt; on-line resizing required
Performing an on-line resize of /dev/vg01/lv01 to 393216 (4k) blocks.
The filesystem on /dev/vg01/lv01 is now 393216 blocks long.

[root@raid ~]# df -h
/dev/mapper/vg01-lv01
                  1.5G 18M  1.4G 2% /mnt  --再次查看,已经挂载的lv扩大了，并且数据没有影响

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

lv的缩小

做缩小操作之前，都要去验证查看一下数据的大小，缩小时不要缩到比已经存在的数据量还要小(数据库内的表空间缩小也是一样要先查看已有数据大小）

[root@raid ~]# resize2fs /dev/vg01/lv01 1g --这样去缩小的话，报错已经mount了
resize2fs 1.39 (29-May-2006)
Filesystem at /dev/vg01/lv01 is mounted on /mnt; on-line resizing required
On-line shrinking from 393216 to 262144 not supported.

[root@raid ~]# umount /mnt/

[root@raid ~]# resize2fs /dev/vg01/lv01 1g --umount后再使用resize2fs命令，要求先去e2fsck检测
resize2fs 1.39 (29-May-2006)
Please run 'e2fsck -f /dev/vg01/lv01' first.

[root@raid ~]# e2fsck -f /dev/vg01/lv01
e2fsck 1.39 (29-May-2006)
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
/dev/vg01/lv01: 12/192000 files (8.3% non-contiguous), 10517/393216 blocks

[root@raid ~]# resize2fs /dev/vg01/lv01 1g --检测后再使用resize2fs命令缩小，并挂载查看大小是否缩小
resize2fs 1.39 (29-May-2006)
Resizing the filesystem on /dev/vg01/lv01 to 262144 (4k) blocks.
The filesystem on /dev/vg01/lv01 is now 262144 blocks long.

[root@raid ~]# lvscan
  ACTIVE          '/dev/vg01/lv01' [1.50 GB] inherit --但这里查看的还是1.5g
  ACTIVE          '/dev/vg01/lv02' [1000.00 MB] inherit

[root@raid ~]# lvreduce -L 1g /dev/vg01/lv01    --所以lvreduce也要做
  WARNING: Reducing active logical volume to 1.00 GB
  THIS MAY DESTROY YOUR DATA (filesystem etc.)
Do you really want to reduce lv01? [y/n]: y
  Reducing logical volume lv01 to 1.00 GB
  Logical volume lv01 successfully resized

[root@raid ~]# lvscan
  ACTIVE          '/dev/vg01/lv01' [1.00 GB] inherit --OK
  ACTIVE          '/dev/vg01/lv02' [1000.00 MB] inherit

[root@raid ~]# mount /dev/vg01/lv01 /mnt/

[root@raid ~]# df -h
/dev/mapper/vg01-lv02
                  985M 18M  918M 2% /media --缩小了

====================================================================

lvm 快照功能  snapshot

1,快照创建的速度非常快，不需要停止生产环境
2,快照的大小是存储差异数据，或是快照时间点的状态，不需要和lv同大小
3,它可以用于一些特殊的情况，比如数据库备份，或者批量复制虚拟机（不关闭虚拟机的情况下，克隆是需要关闭或暂停虚拟机的),虚拟机做快照等

实验：

[root@raid ~]# dd if=/dev/zero of=/media/10m bs=1M count=10

[root@raid ~]# dd if=/dev/zero of=/media/20m bs=1M count=20

[root@raid ~]# dd if=/dev/zero of=/media/30m bs=1M count=30

[root@raid ~]# ls /media/ -l
total 61532
-rw-r--r-- 1 root root 10485760 May  7 15:18 10m
-rw-r--r-- 1 root root 20971520 May  7 15:18 20m
-rw-r--r-- 1 root root 31457280 May  7 15:18 30m
drwx------ 2 root root 16384 May  7 14:17 lost+found

[root@raid ~]# lvcreate -s -L 100m -n snap01 /dev/vg01/lv02 --L参数指定的大小不是快照大小，它类似于一个快照存活的时间（由源的改变来定义存活时间的长短。源增加多少，这个100M‘时间‘就会被使用多少，源删除，这个100M时间只会被增加一点点，因为删除只记录它的一个innode失效。但注意，快照的内容不会跟着改变。
  Logical volume "snap01" created

[root@raid ~]# ls /dev/vg01/snap01
/dev/vg01/snap01

[root@raid ~]# mkdir /snap
[root@raid ~]# mount /dev/vg01/snap01 /snap/

[root@raid ~]# ls /snap/ --快照的内容
10m  20m  30m  lost+found

[root@raid ~]# dd if=/dev/zero of=/media/50m bs=1M count=50
--在源目录加一个50M的文件

[root@raid ~]# ls /snap/ --快照的内容不会跟着变
10m  20m  30m  lost+found

[root@raid ~]# lvs
  LV    VG Attr LSize Origin Snap%  Move Log Copy%  Convert
  lv01 vg01 -wi-ao 1.00G
  lv02 vg01 owi-ao 1000.00M
  snap01 vg01 swi-ao  100.00M lv02 50.48 --但是这个snap%会发现由几乎为0变化到50%

--下面再可以继续做试验：
1，在源删除一个文件，再使用lvs查看  %snap只会增加一点点
2，当%snap用完了100%，则快照失效。umount和mount快照都会出问题
3, 快照的内容不会跟着源改变

[root@raid ~]# lvremove /dev/vg01/snap01    --快照的移除
Do you really want to remove active logical volume snap01? [y/n]: y
  Logical volume "snap01" successfully removed

		自动登录	找回密码
密码			立即注册

【学习笔记】Linux系统存储结构

浏览过的版块