Linux编程--文件原子 *** 作_系统运维

当多个进程同时访问一个文件的时候，普通的write/read在执行的时候，无法保证 *** 作的原子性，可能会导致文件被污染，达不到预期的结果。

任何一个需要多个函数调用的 *** 作都不可能是原子 *** 作，因为在两个函数调用间，内核可能会将进程挂起执行另外的进程。

如果想要避免这种情况的话，则需要使用pread/pwrite函数

ssize_t pread(int fd ，void *buffer ，size_t size，off_t offset)

返回真正读取到的字节数，offset是指的从文件开始位置起的offset个字节数开始读。其余的参数与read无异。

PS:

pread是无法中断的原子 *** 作，无法中断它的定位和读取 *** 作

pread读取过后的文件偏移量不会发生改变

同理pwrite也是一样的

而在文件创建的时候也是一样的，当需要做文件创建同步的时候，我们需要在O_CREATE的时候，加上O_EXCL标志位，当已经创建过的话，会返回fd，否则返回错误

int dup( int filedes)：

传入一个文件描述符，返回当前可用的最小文件描述符。

int dup2(int filedes，int filedes2)：

传入文件描述符，以及新的文件描述符，如果新的文件描述符所指向的文件已经打开，则会强行将其关闭后，将该文件描述符指向到已存在的文件描述符。

如果filedes和filedes2指向同一个文件，则不做任何处理，直接返回filedes2，不会关闭文件

新返回回来的filedes2会共享filedes的文件状态标识，文件偏移量等等信息。因为它们的文件指针会指向文件表的同一个位置。只是fd不一样而已。

linux中关于原子 *** 作

2016年08月02日

原子 *** 作:就是在执行某一 *** 作时不被打断。

linux原子 *** 作问题来源于中断、进程的抢占以及多核smp系统中程序的并发执行。

对于临界区的 *** 作可以加锁来保证原子性，对于全局变量或静态变量 *** 作则需要依赖于硬件平台的原子变量 *** 作。

因此原子 *** 作有两类：一类是各种临界区的锁，一类是 *** 作原子变量的函数。

对于arm来说，单条汇编指令都是原子的，多核smp也是，因为有总线仲裁所以cpu可以单独占用总线直到指令结束，多核系统中的原子 *** 作通常使用内存栅障（memory barrier）来实现，即一个CPU核在执行原子 *** 作时，其他CPU核必须停止对内存 *** 作或者不对指定的内存进行 *** 作，这样才能避免数据竞争问题。但是对于load update store这个过程可能被中断、抢占，所以arm指令集有增加了ldrex/strex这样的实现load update store的原子指令。

但是linux种对于c/c++程序（一条c编译成多条汇编），由于上述提到的原因不能保证原子性，因此linux提供了一套函数来 *** 作全局变量或静态变量。

一.整型原子 *** 作定义于#include<asm/atomic.h>分为定义，获取，加减，测试，返回。void atomic_set(atomic_t *v,int i) //设置原子变量v的值为iatomic_t v = ATOMIC_INIT(0) //定义原子变量v,并初始化为0atomic_read(atomic_t* v) //返回原子变量v的值void atomic_add(int i, atomic_t* v) //原子变量v增加ivoid atomic_sub(int i, atomic_t* v) void atomic_inc(atomic_t* v) //原子变量增加1void atomic_dec(atomic_t* v) int atomic_inc_and_test(atomic_t* v) //先自增1,然后测试其值是否为0,若为0,则返回true,否则返回falseint atomic_dec_and_test(atomic_t* v) int atomic_sub_and_test(int i, atomic_t* v) //先减i,然后测试其值是否为0,若为0,则返回true,否则返回false注意：只有自加，没有加 *** 作int atomic_add_return(int i, atomic_t* v) //v的值加i后返回新的值int atomic_sub_return(int i, atomic_t* v) int atomic_inc_return(atomic_t* v) //v的值自增1后返回新的值int atomic_dec_return(atomic_t* v) 二.位原子 *** 作定义于#include<asm/bitops.h>分为设置，清除，改变，测试void set_bit(int nr, volatile void* addr) //设置地址addr的第nr位,所谓设置位,就是把位写为1void clear_bit(int nr, volatile void* addr) //清除地址addr的第nr位,所谓清除位,就是把位写为0void change_bit(int nr, volatile void* addr) //把地址addr的第nr位反转int test_bit(int nr, volatile void* addr) //返回地址addr的第nr位int test_and_set_bit(int nr, volatile void* addr) //测试并设置位若addr的第nr位非0,则返回true若addr的第nr位为0,则返回falseint test_and_clear_bit(int nr, volatile void* addr) //测试并清除位int test_and_change_bit(int nr, volatile void* addr) //测试并反转位上述 *** 作等同于先执行test_bit(nr,voidaddr)然后在执行xxx_bit(nr,voidaddr)

举个简单例子：为了实现设备只能被一个进程打开，从而避免竞态的出现static atomic_t scull_available = ATOMIC_INIT(1) //init atomic在scull_open 函数和scull_close函数中：int scull_open(struct inode *inode, struct file *filp){ struct scull_dev *dev // device information dev = container_of(inode->i_cdev, struct scull_dev, cdev) filp->private_data = dev // for other methods if(!atomic_dec_and_test(&scull_available)){ atomic_inc(&scull_available) return -EBUSY } return 0 // success }int scull_release(struct inode *inode, struct file *filp){ atomic_inc(&scull_available) return 0}

假设原子变量的底层实现是由一个汇编指令实现的，这个原子性必然有保障。但是如果原子变量的实现是由多条指令组合而成的，那么对于SMP和中断的介入会不会有什么影响呢？我在看ARM的原子变量 *** 作实现的时候，发现其是由多条汇编指令（ldrex/strex）实现的。在参考了别的书籍和资料后，发现大部分书中对这两条指令的描诉都是说他们是支持在SMP系统中实现多核共享内存的互斥访问。但在UP系统中使用，如果ldrex/strex和之间发生了中断，并在中断中也用ldrex/strex *** 作了同一个原子变量会不会有问题呢？就这个问题，我认真看了一下内核的ARM原子变量源码和ARM官方对于ldrex/strex的功能解释，总结如下：

一、ARM构架的原子变量实现结构

对于ARM构架的原子变量实现源码位于：arch/arm/include/asm/atomic.h

其主要的实现代码分为ARMv6以上（含v6）构架的实现和ARMv6版本以下的实现。

该文件的主要结构如下：

#if __LINUX_ARM_ARCH__ >= 6

......(通过ldrex/strex指令的汇编实现)

#else /* ARM_ARCH_6 */

#ifdef CONFIG_SMP

#error SMP not supported on pre-ARMv6 CPUs

#endif

......(通过关闭CPU中断的C语言实现)

#endif /* __LINUX_ARM_ARCH__ */

......

#ifndef CONFIG_GENERIC_ATOMIC64

......(通过ldrexd/strexd指令的汇编实现的64bit原子变量的访问)

#else /* !CONFIG_GENERIC_ATOMIC64 */

#include <asm-generic/atomic64.h>

#endif

#include <asm-generic/atomic-long.h>

这样的安排是依据ARM核心指令集版本的实现来做的：

（1）在ARMv6以上（含v6）构架有了多核的CPU，为了在多核之间同步数据和控制并发，ARM在内存访问上增加了独占监测（Exclusive monitors）机制（一种简单的状态机），并增加了相关的ldrex/strex指令。请先阅读以下参考资料（关键在于理解local monitor和Global monitor）：

1.2.2. Exclusive monitors

4.2.12. LDREX 和 STREX

（2）对于ARMv6以前的构架不可能有多核CPU，所以对于变量的原子访问只需要关闭本CPU中断即可保证原子性。

对于（2），非常好理解。

但是（1）情况，我还是要通过源码的分析才认同这种代码，以下我仅仅分析最具有代表性的atomic_add源码，其他的API原理都一样。如果读者还不熟悉C内嵌汇编的格式，请参考《ARM GCC 内嵌汇编手册》

二、内核对于ARM构架的atomic_add源码分析

* ARMv6 UP 和 SMP 安全原子 *** 作。我们是用独占载入和

* 独占存储来保证这些 *** 作的原子性。我们可能会通过循环

* 来保证成功更新变量。

static inline void atomic_add(int i, atomic_t *v)

{

unsigned long tmp

int result

__asm__ __volatile__("@ atomic_add\n"

"1: ldrex %0, [%3]\n"

" add %0, %0, %4\n"

" strex %1, %0, [%3]\n"

" teq %1, #0\n"

" bne 1b"

: "=&r" (result), "=&r" (tmp), "+Qo" (v->counter)

: "r" (&v->counter), "Ir" (i)

: "cc")

}

源码分析：

注意：根据内联汇编的语法，result、tmp、&v->counter对应的数据都放在了寄存器中 *** 作。如果出现上下文切换，切换机制会做寄存器上下文保护。

（1）ldrex %0, [%3]

意思是将&v->counter指向的数据放入result中，并且（分别在Local monitor和Global monitor中）设置独占标志。

（2）add %0, %0, %4

result = result + i

（3）strex %1, %0, [%3]

意思是将result保存到&v->counter指向的内存中，此时 Exclusive monitors会发挥作用，将保存是否成功的标志放入tmp中。

（4） teq %1, #0

测试strex是否成功（tmp == 0 ？？）

（5）bne 1b

如果发现strex失败，从（1）再次执行。

通过上面的分析，可知关键在于strex的 *** 作是否成功的判断上。而这个就归功于ARM的Exclusive monitors和ldrex/strex指令的机制。以下通过可能的情况分析ldrex/strex指令机制。（请阅读时参考4.2.12. LDREX 和 STREX）

1、UP系统或SMP系统中变量为非CPU间共享访问的情况

此情况下，仅有一个CPU可能访问变量，此时仅有Local monitor需要关注。

假设CPU执行到（2）的时候，来了一个中断，并在中断里使用ldrex/strex *** 作了同一个原子变量。则情况如下图所示：

A：处理器标记一个物理地址，但访问尚未完毕

B：再次标记此物理地址访问尚未完毕（与A重复）

C：进行存储 *** 作，清除以上标记，返回0（ *** 作成功）

D：不会进行存储 *** 作，并返回1（ *** 作失败）

也就是说，中断例程里的 *** 作会成功，被中断的 *** 作会失败重试。

2、SMP系统中变量为CPU间共享访问的情况

此情况下，需要两个CPU间的互斥访问，此时ldrex/strex指令会同时关注Local monitor和Global monitor。

（i）两个CPU同时访问同个原子变量（ldrex/strex指令会关注Global monitor。）

A：将该物理地址标记为CPU0独占访问，并清除CPU0对其他任何物理地址的任何独占访问标记。

B：标记此物理地址为CPU1独占访问，并清除CPU1对其他任何物理地址的任何独占访问标记。

C：没有标记为CPU0独占访问，不会进行存储，并返回1（ *** 作失败）。

D：已被标记为CPU1独占访问，进行存储并清除独占访问标记，并返回0（ *** 作成功）。

也就是说，后执行ldrex *** 作的CPU会成功。

（ii）同一个CPU因为中断，“嵌套”访问同个原子变量（ldrex/strex指令会关注Local monito）

A：将该物理地址标记为CPU0独占访问，并清除CPU0对其他任何物理地址的任何独占访问标记。

B：再次标记此物理地址为CPU0独占访问，并清除CPU0对其他任何物理地址的任何独占访问标记。

C：已被标记为CPU0独占访问，进行存储并清除独占访问标记，并返回0（ *** 作成功）。

D：没有标记为CPU0独占访问，不会进行存储，并返回1（ *** 作失败）。

也就是说，中断例程里的 *** 作会成功，被中断的 *** 作会失败重试。

（iii）两个CPU同时访问同个原子变量，并同时有CPU因中断“嵌套”访问改原子变量（ldrex/strex指令会同时关注Local monitor和Global monitor）

虽然对于人来说，这种情况比较BT。但是在飞速运行的CPU来说，BT的事情随时都可能发生。

A：将该物理地址标记为CPU0独占访问，并清除CPU0对其他任何物理地址的任何独占访问标记。

B：标记此物理地址为CPU1独占访问，并清除CPU1对其他任何物理地址的任何独占访问标记。

C：再次标记此物理地址为CPU0独占访问，并清除CPU0对其他任何物理地址的任何独占访问标记。

D：已被标记为CPU0独占访问，进行存储并清除独占访问标记，并返回0（ *** 作成功）。

E：没有标记为CPU1独占访问，不会进行存储，并返回1（ *** 作失败）。

F：没有标记为CPU0独占访问，不会进行存储，并返回1（ *** 作失败）。

当然还有其他许多复杂的可能，也可以通过ldrex/strex指令的机制分析出来。从上面列举的分析中，我们可以看出：ldrex/strex可以保证在任何情况下（包括被中断）的访问原子性。所以内核中ARM构架中的原子 *** 作是可以信任的。

1.atomic_read与atomic_set函数是原子变量的 *** 作，就是原子读和原子设置的作用.2.原子 *** 作，就是执行 *** 作的时候，其数值不会被其它线程或者中断所影响3.原子 *** 作是linux内核中一种同步的方式

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/7102621.html

Linux编程--文件原子 *** 作

发表评论

评论列表（0条）