test Blog
Happy living

Linux 文件基本知识

老鼠 posted @ 2009年4月15日 04:12 in linux with tags linux 文件 , 2241 阅读

参考资料

  《深入理解Linux内核(第三版)》之1.5. An Overview of the Unix Filesystem
 《LINUX与UNIX SHELL编程指南》第一章
 
2008-10-10 根据参考资料1,2创建初稿。
文件类型
Unix 文件可以是下列类型之一 :
• 普通文件(regular file)
• 目录
• 符号链接
• 面向块的设备文件(block-oriented device file)
• 面向字符的设备文件(character-oriented device file)
• 管道(pipe)和命名管道(named pipe)(也叫FIFO)
• 套接字(socket)
前三种文件类型是所有Unix 文件系统的基本类型。设备文件与I/O 设备以及集成到内核中的设备驱动程序相关。例如,当程序访问设备文件时,它直接访问与那个文件相关的I/O 设备。管道和套接字是用于进程间通信的特殊文件。
文件描述符与索引节点
Unix对文件的内容和描述文件的信息给出了清楚的区分。除了设备文件和特殊文件系统文件外,每个文件都由字符序列组成。文件内容不包含任何控制信息,如文件长度或文件结束(end-of-file,EOF)符。
文件系统处理文件需要的所有信息包含在一个名为索引节点(inode)的数据结构中。每个文件都有自己的索引节点,文件系统用索引节点来标识文件。
虽然文件系统及内核函数对索引节点的处理可能随Unix系统的不同有很大的差异,但它们必须至少提供在POSIX 标准中指定的如下属性:
 
 
• 文件类型
• 与文件相关的硬链接个数
• 以字节为单位的文件长度
• 设备标识符(即包含文件的设备的标识符)
• 在文件系统中标识文件的索引节点号
• 文件拥有者的UID
• 文件的用户组ID
• 几个时间戳,表示索引节点状态改变的时间、最后访问时间及最后修改时间
• 访问权限和文件模式
 
       另有文件的位置。
 
访问权限和文件模式
 
文件的潜在用户分为三种类型:
• 作为文件所有者的用户
• 同组用户,不包括所有者
• 所有剩下的用户(其他)
有三种类型的访问权限——读、写及执行每组用户都有这三种权限。因此,文件访问权限的组合就用九种不同的二进制来标记。还有三种附加的标记,即suid (Set User ID), sgid (Set Group ID),及sticky 用来定义文件的模式。当这些标记应用到可执行文件时有如下含义:
suid
进程执行一个文件时通常保持进程拥有者的UID。然而,如果设置了可执行文件
suid 的标志位,进程就获得了该文件拥有者的UID。
sgid
进程执行一个文件时保持进程组的用户组ID。然而,如果设置了可执行文件sgid
的标志位,进程就获得了该文件用户组的ID。
sticky
设置了sticky 标志位的可执行文件相当于向内核发出一个请求,当程序执行结
束以后,依然将它保留在内存(这个标志已经过时,现在使用基于代码页共享的其他方法)。
 
当文件由一个进程创建时,文件拥有者的ID 就是该进程的UID。而其用户组ID 可以是进程创建者的ID,也可以是父目录的ID,这取决于父目录sgid 标志位的值。
对于文件属主来说,在只有读权限位被置位的情况下,仍然可以通过文件重定向的方法向该文件写入。能否删除一个文件还依赖于该文件所在目录权限位的设置。
 
hmod [who] operator [permission] filename
who的含义是:
u 文件属主权限。
g 同组用户权限。
o 其他用户权限。
operator的含义:
+ 增加权限。
- 取消权限。
= 设定权限。
permission的含义:
r 读权限。
w 写权限。
x 执行权限。
s 文件属主和组set-ID。
t 粘性位*。
l 给文件加锁,使其他用户无法访问。
u,g,o 针对文件属主、同组用户及其他用户的操作。
*在列文件或目录时,有时会遇到“ t”位。“t”代表了粘性位。如果在一个目录上出现
“t”位,这就意味着该目录中的文件只有其属主才可以删除,即使某个同组用户具有和属主
同等的权限。不过有的系统在这一规则上并不十分严格。
如果在文件列表时看到“ t”,那么这就意味着该脚本或程序在执行时会被放在交换区(虚
存)。不过s于当今的内存价格如此之低,大可不必理会文件的“ t”的使用。
 
还可以通过使用- R选项连同子目录下的文件一起设置:
chmod -R 664 /usr/local/home/dave/*
这样就可以一次将/usr/local/home/dave目录下的所有文件连同各个子目录下的文件的权限全部设置为文件属主和同组用户可读和写,其他用户只读。使用- R选项一定要谨慎,只有在需要改变目录树下全部文件权限时才可以使用。
目录的读权限位意味着可以列出其中的内容。写权限位意味着可以在该目录中创建文件,如果不希望其他用户在你的目录中创建文件,可以取消相应的写权限位.
    如果把同组用户或其他用户针对某一目录的权限设置为--x,那么他们将无法列出该目录中的文件。如果该目录中有一个执行位置位的脚本或程序,只要用户知道它的路径和文件名,仍然可以执行它。用户不能够进入该目录并不妨碍他的执行。
文件操作的系统调用
当用户访问一个普通文件或目录文件的内容时,他实际上是访问存储在硬件块设备上的一些数据。从这个意义上说,文件系统是硬盘分区物理组织的用户级视图。因为处于用户态的进程不能直接与低层硬件交互,所以每个实际的文件操作必须在内核态下进行。因此,Unix 操作系统定义了几个与文件操作有关的系统调用。
所有Unix内核都对硬件块设备的处理效率给予极大关注,其目的是为了获得非常好的系统整体性能。在后面的章节中,我们将描述Linux 与文件操作相关的主题,尤其是讨论内核如何对文件相关的系统调用作出反应。为了理解这些内容,你需要知道如何使用文件操作的主要系统调用。下面对此给予描述。
*访问打开的文件
对普通Unix 文件,可以顺序地访问,也可以随机地访问,而对设备文件和命名管道文件,通常只能顺序地访问。在这两种访问方式中,内核把文件指针存放在打开文件对象中,也就是说,当前位置就是下一次进行读或写操作的位置。
顺序访问是文件的默认访问方式,即read()和 write()系统调用总是从文件指针的当前位置开始读或写。为了修改文件指针的值,必须在程序中显式地调用lseek()系统调用。当打开文件时,内核让文件指针指向文件的第一个字节(偏移量为0)。
lseek()系统调用需要下列参数:
newoffset=lseek(fd, offset, whence);
其参数含义如下:
fd
表示打开文件的文件描述符。
offset
指定一个有符号整数值,用来计算文件指针的新位置。
whence
指定文件指针新位置的计算方式:可以是offset 加0,表示文件指针从文件头移动;
也可以是offset 加文件指针的当前位置,表示文件指针从当前位置移动;还可以是
offset 加文件最后一个字节的位置,表示文件指针从文件末尾开始移动。
 
read()系统调用需要以下参数:
nread= read(fd, buf, count);
其参数含义如下:
fd
表示打开文件的文件描述符。
buf
指定在进程地址空间中缓冲区的地址,所读的数据就放在这个缓冲区。
count
表示所读的字节数。
当处理这样的系统调用时,内核会尝试从拥有文件描述符fd的文件中读count个字节,其起始位置为打开文件的offset 字段的当前值。在某些情况下可能遇到文件结束、空管道等等,因此内核无法成功地读出全部count 个字节。返回的nread 值就是实际所读的字节数。给原来的值加上nread 就会更新文件指针。write()的参数与read()相似。
 
*关闭文件
当进程无需再访问文件的内容时,就调用系统调用:
res=close(fd);
释放与文件描述符fd 相对应的打开文件对象。当一个进程终止时,内核会关闭其所有仍然打开着的文件。*更名及删除文件
要重新命名或删除一个文件时,进程不需要打开它。实际上,这样的操作并没有对这个文件的内容起作用,而是对一个或多个目录的内容起作用。例如,系统调用:
res= rename(oldpath, newpath);
改变了文件链接的名字,而系统调用:
res= unlink(pathname);
减少了文件链接数,删除了相应的目录项。只有当链接数为0 时,文件才被真正删除。

登录 *


loading captcha image...
(输入验证码)
or Ctrl+Enter