Rust 布局

我们先来看看结构体的布局。Vec由三部分组成:一个指向分配空间的指针、空间的大小、以及已经初始化的元素的数量。

简单来说,我们的设计只要这样:

pub struct Vec<T> {
    ptr: *mut T,
    cap: usize,
    len: usize,
}

这段代码可以通过编译。可不幸的是,它是不正确的。首先,编译器产生的变性过于严格。所以&Vev<&'static str>不能当做&Vev<&'a str>使用。更主要的是,它会给drop检查器传递错误的所有权信息,因为编译器会保守地假设我们不拥有任何的值。

.
正如我们在所有权一章见到的,当裸指针指向一块我们拥有所有权的位置,我们应该使用Unique<T>代替*mut T。尽管Unique是不稳定的,我们尽可能不去使用它。

复习一下,Unique封装了一个裸指针,并且声明它自己:

  • T可变
  • 拥有类型T的值(用于drop检查)
  • 如果T是Send/Sync,那就也是Send/Sync
  • 指针永远不为null(所以`Option<Vec>可以做空指针优化)

除了最后一点,其余的我们都可以用稳定的Rust实现:

use std::marker::PhantomData;
use std::ops::Deref;
use std::mem;

struct Unique<T> {
    ptr: *const T,            // 使用*const保证变性  
    _marker: PhantomData<T>,  // 用于drop检查
}

// 设置Send和Sync是安全地,因为我们是Unique中的数据的所有者
// Unique<t>好像就是T一样
unsafe impl<T: Send> Send for Unique<T> {}
unsafe impl<T: Sync> Sync for Unique<T> {}

impl<T> Unique<T> {
    pub fn new(ptr: *mut T) -> Self {
        Unique { ptr: ptr, _marker: PhantomData }
    }

    pub fn as_ptr(&self) -> *mut T {
        self.ptr as *mut T
    }
}

可是,声明数据不为0的方法是不稳定的,而且短期内都不太可能会稳定下来。所以我们还是接受现实,使用标准库的Unique:

#![feature(ptr_internals)]

use std::ptr::{Unique, self};

pub struct Vec<T> {
    ptr: Unique<T>,
    cap: usize,
    len: usize,
}

如果你不太在意空指针优化,那么你可以使用稳定代码。但是我们之后的代码会依赖于这个优化去设计。还要注意,调用Unique::new是非安全的,因为给它传递null属于未定义行为。我们的稳定Unique就不需要让new是非安全的,因为它没有对于它的内容做其他的保证。

使用Unique会给Vec(以及所有的标准库集合)带来一个问题:空的Vec不会分配内存。如果既不能分配内存,又不能给ptr传递一个空指针,那我们在Vec::new中能做什么呢?好吧,我们就胡乱往Vec里塞点东西。这么做没 ...