Arceos 启动流程拆解

前言

注：本文默认读者已具备基础的 RISC-V 体系结构及常规操作系统理论知识，底层硬件常识将不再赘述。

于我而言，写项目前，完整了解项目前期的启动及相关的内容是及其必要，可以完整了解整个项目的运转方式，掌握开发流程。

所以下文是简单的对ArceOS的架构解析，只针对RISCV。

Makefile分析

ArceOS并不是一个大型或者中型的项目，所以，可以直接来通过Makefile来分析整个项目的构建流程和启动流程。

Makefile文件在项目的根目录下和scripts/make/目录下

# scripts/make/build.mk
_cargo_build:
    @printf "    $(GREEN_C)Building$(END_C) App: $(APP_NAME), Arch: $(ARCH), Platform: $(PLATFORM_NAME), App type: $(APP_TYPE)\n"
ifeq ($(APP_TYPE), rust)
    $(call cargo_build,$(APP),$(AX_FEAT) $(LIB_FEAT) $(APP_FEAT))
    @cp $(rust_elf) $(OUT_ELF)
else ifeq ($(APP_TYPE), c)
    $(call cargo_build,ulib/axlibc,$(AX_FEAT) $(LIB_FEAT))
endif

# scripts/make/cargo.mk
define cargo_build
  $(call run_cmd,cargo -C $(1) build,$(build_args) --features "$(strip $(2))")
endef

# scripts/make/features.mk
ifeq ($(APP_TYPE),c)
  ax_feat_prefix := axfeat/
  lib_feat_prefix := axlibc/
  lib_features := fp_simd irq alloc multitask fs net fd pipe select epoll
else
  # TODO: it's better to use `axfeat/` as `ax_feat_prefix`, but all apps need to have `axfeat` as a dependency
  ax_feat_prefix := axstd/
  lib_feat_prefix := axstd/
  lib_features :=
endif

override FEATURES := $(shell echo $(FEATURES) | tr ',' ' ')

ifeq ($(APP_TYPE), c)
  ifneq ($(wildcard $(APP)/features.txt),)    # check features.txt exists
    override FEATURES += $(shell cat $(APP)/features.txt)
  endif
  ifneq ($(filter fs net pipe select epoll,$(FEATURES)),)
    override FEATURES += fd
  endif
endif

override FEATURES := $(strip $(FEATURES))

ax_feat :=
lib_feat :=

...
...

ax_feat += $(filter-out $(lib_features),$(FEATURES))
lib_feat += $(filter $(lib_features),$(FEATURES))

AX_FEAT := $(strip $(addprefix $(ax_feat_prefix),$(ax_feat)))
LIB_FEAT := $(strip $(addprefix $(lib_feat_prefix),$(lib_feat)))
APP_FEAT := $(strip $(shell echo $(APP_FEATURES) | tr ',' ' '))

在这里面，这是负责编译整个内核代码的部分

需要注意的是，在makefile文件中，并没有直接的将modules\文件夹放入到cargo中编译，因为Rust采用的依赖来进行编译，这也就是为什么我会在上图中将features.mk的代码也会拿出来，所以正常在编译rust内核的时候，都会选选择axstd/，我们就可以使用cargo tree -p axstd进行查看，当然，因为features可选的缘故，那些没有选择的模块并不会出现在树形图中，具体可以看axfeat的Cargo.toml

在ArceOS中，axfeat作为顶层的特性选择，是通过Cargo.toml的特性传递来实现最终到axfeat的，比如其中的axstd/Cargo.toml中的fs = ["arceos_api/fs", "axfeat/fs"]，就会传递到axfeat/中，因此最后的编译器会根据依赖进行编译axfeat。具体的特性传递，可以查阅官方的Cargo手册中的features部分

启动流程

启动的代码部分被放在了架构抽象层modules/axhal中，因为OS代码并不是普通的执行文件，所以需要链接器来规划地址空间。

    .text : ALIGN(4K) {
        _stext = .;
        *(.text.boot)
        *(.text .text.*)
        . = ALIGN(4K);
        _etext = .;
    }

对于ELF文件的解析，具体查阅System V Application Binary Interface

通常来说，为了区分启动函数的代码，和其他的代码，启动函数代码一般都会使用一个区别于纯.text的名字，在这里就是.text.boot，我们可以通过搜索找到对应的启动代码。

// modules/axhal/src/platform/riscv64-qemu-vire/boot.rs

/// The earliest entry point for the primary CPU.
#[naked]
#[no_mangle]
#[link_section = ".text.boot"]
unsafe extern "C" fn _start() -> ! {
    ...
    entry = sym super::rust_entry,
    ...
}

再通过搜索rust_entry找下一阶段的代码，同理，最后我们就会找到modules/axruntime/src/lib.rs最后使用的rust_main的OS初始化流程及启动代码

// modules/axruntime/src/lib.rs

extern "C" {
    fn main();
}

#[cfg_attr(not(test), no_mangle)]
pub extern "C" fn rust_main(cpu_id: usize, dtb: usize) -> ! {
...
    unsafe { main() };
...
}

在这里启动的main就是我们一般要进行测试时使用的app中的main，至此OS的启动就完成了。

关于为什么main是app中的，如果你检索一下modules库，你就会发现，modules中并没有专门的main来运行和管理一个OS，而且这也就是ArceOS的Unikernel的设计思路，以库为核心，通过拆分功能，以实现组件化的内核，而且运行时都是在Supervisor-Level特权级下。

当然，具体的审阅为什么main是我们编译的app中的，还是要看makefile文件，$(call cargo_build,$(APP),$(AX_FEAT) $(LIB_FEAT) $(APP_FEAT))，其中的APP就是我们在编译时选择APP或A的路径。

顶层设计

在整体的框架中ulib中存放APP需要的功能，同时ulib中的axstd和axlibc都是依赖于axfeat的，其中axstd依赖arceos_api，axlibc依赖arceos_posix_api，arceos_api和arceos_poxis_api依赖modules

所以就可以画出这样的图：

graph TD
    APP[Application]

    %% ulib
    subgraph ulib [ulib: APP Features]
        axstd[axstd]
        axlibc[axlibc]
    end

    %% APP dependencies ulib
    APP --> axstd
    APP --> axlibc

    %% API dependencies
    axstd --> arceos_api[arceos_api]
    axlibc --> arceos_posix_api[arceos_posix_api]

    %% Features dependencies
    arceos_api --> axfeat[axfeat]
    arceos_posix_api --> axfeat

    %% Low dependencies
    axfeat --> modules[modules]

    style APP fill:#fff,stroke:#333,stroke-width:2px
    style ulib fill:#f9f,stroke:#333,stroke-width:2px
    style modules fill:#bbf,stroke:#333,stroke-width:2px

库模块

整个ArceOS中最核心的代码，都是在modules中的。

modules
- alt_alloc: 替代内存分配器
- axalloc: 内存分配器
- axfs：文件系统
- axhal: 硬件抽象代码
- axmm：地址空间管理
- bump_allocator: 早期内存分配器
- axruntime: 系统初始化构建

只放置了我看了的库，其他的模块还没看

`axhal`

在这个库中，包含了硬件相关和硬件无关的代码，以及系统的启动，初始化和设置。

这里只说一下经常用到的。

其中，src/arch/目录下是硬件相关的代码，也就是硬件相关，在src/下的rs文件则是硬件无关的代码。

arch/riscv/
- context.rs: 包含了中断处理，上下文切换，设置页表，切换任务，进入用户空间等硬件相关的操作
- mod.rs: 包含设置中断向量，启用禁止中断，停机，刷新TLB等硬件相关操作
- trap.rs: 包含中断处理，缺页处理
platform/riscv64
- boot.rs: 包含硬件相关的初始化分页，和系统启动及设置
- mod：包含进入rust_main的处理
mem.rs: 包含硬件无关VA --> PA和PA --> VA，物理地址空间结构体，默认空闲空间和默认mmio映射空间
paging.rs: 包含硬件无关的获取页表，设置页表，分页处理等
trap.rs: 包含硬件无关的中断处理，和系统调用分发

`bump_allocator`

操作系统在初始化前期，还在处于一个鸡生蛋，还是蛋生鸡的问题上，也就是，你想要启用分页，但是启用分页需要页表，页表本身又占用内存空间，如果你还没有页表和内存管理器，你从哪里申请空间来存放这些页表？然后就卡住了，解决办法也很简单，用一个最简单的方式来建立一个不怎么正规，但要合理且易用的内存分配器，也就是早期分配器。

早期分配器的设计思路也很简单，我就直接把bump_allocator的注释拿过来了。

// modules/bump_allocator/src/lib.rs

/// Early memory allocator
/// Use it before formal bytes-allocator and pages-allocator can work!
/// This is a double-end memory range:
/// - Alloc bytes forward
/// - Alloc pages backward
///
/// [ bytes-used | avail-area | pages-used ]
/// |            | -->    <-- |            |
/// start       b_pos        p_pos       end
///
/// For bytes area, 'count' records number of allocations.
/// When it goes down to ZERO, free bytes-used area.
/// For pages area, it will never be freed!

设计思路就是，找一块空闲的地址，低地址放bytes-used，高地址放page-used，两边向中间增长。

所以，这样就可以了。

// modules/bump_allocator/src/lib.rs

pub struct EarlyAllocator<const SIZE: usize> {
    bytes_start: usize,
    b_pos: usize,
    p_pos: usize,
    pages_end: usize,
}

关于为什么For pages area, it will never be freed!,主要是，OS启动后会开启分页，后在初始化的阶段，使用了alt_alloc分配内存映射内核代码，所以要是Free直接炸了。

alt_alloc依赖bump_allocator进行管理内存

一点额外的内容

在ArceOS中，似乎并没有体现出对alt_alloc的用处，在特性选择的时候，可以选择alt_alloc或者是alloc，不管选择什么特性，OS在初始化中都是在同一个地方进行初始化，而且他们区别仅在于内存分配器的选择。

pub extern "C" fn rust_main(cpu_id: usize, dtb: usize) -> ! {
...
    info!("Found physcial memory regions:");
    for r in axhal::mem::memory_regions() {
        info!(
            "  [{:x?}, {:x?}) {} ({:?})",
            r.paddr,
            r.paddr + r.size,
            r.name,
            r.flags
        );
    }

    #[cfg(any(feature = "alloc", feature = "alt_alloc"))]
    init_allocator();
...
}

#[cfg(feature = "alloc")]
fn init_allocator() {
    use axhal::mem::{memory_regions, phys_to_virt, MemRegionFlags};
...
        axalloc::global_init(phys_to_virt(r.paddr).as_usize(), r.size);

        axalloc::global_add_memory(phys_to_virt(r.paddr).as_usize(),r.size)

                .expect("add heap memory region failed");
...
}

#[cfg(feature = "alt_alloc")]
fn init_allocator() {
...
            alt_axalloc::global_init(phys_to_virt(r.paddr).as_usize(), r.size);

            alt_axalloc::global_add_memory(phys_to_virt(r.paddr).as_usize(), r.size)
                .expect("add heap memory region failed");
...

从上面的代码也可以看出来，仅仅是改变了一下内存分配器的选择。

核心原因： ArceOS使用的恒等映射的策略，也就是Virtual Address=Physical address

如果我们查看，启动流程中的axhal/linker.lds.S中的链接器设置，axhal/src/mem.rs中内核地址设计和rust_main中的地址映射

# const KERNEL_BASE: usize = 0x8020_0000;

BASE_ADDRESS = %KERNEL_BASE%;

/// Returns the memory regions of the kernel image (code and data sections).
fn kernel_image_regions() -> impl Iterator<Item = MemRegion> {
    [
        MemRegion {
            paddr: virt_to_phys((_stext as usize).into()),
            size: _etext as usize - _stext as usize,
            flags: MemRegionFlags::RESERVED | MemRegionFlags::READ | MemRegionFlags::EXECUTE,
            name: ".text",
        },
        MemRegion {
            paddr: virt_to_phys((_srodata as usize).into()),
            size: _erodata as usize - _srodata as usize,
            flags: MemRegionFlags::RESERVED | MemRegionFlags::READ,
            name: ".rodata",
        },
        MemRegion {
            paddr: virt_to_phys((_sdata as usize).into()),
            size: _edata as usize - _sdata as usize,
            flags: MemRegionFlags::RESERVED | MemRegionFlags::READ | MemRegionFlags::WRITE,
            name: ".data .tdata .tbss .percpu",
        },
        MemRegion {
            paddr: virt_to_phys((boot_stack as usize).into()),
            size: boot_stack_top as usize - boot_stack as usize,
            flags: MemRegionFlags::RESERVED | MemRegionFlags::READ | MemRegionFlags::WRITE,
            name: "boot stack",
        },
        MemRegion {
            paddr: virt_to_phys((_sbss as usize).into()),
            size: _ebss as usize - _sbss as usize,
            flags: MemRegionFlags::RESERVED | MemRegionFlags::READ | MemRegionFlags::WRITE,
            name: ".bss",
        },
    ]
    .into_iter()
}

就可以发现，只是使用了恒等映射，在这种情况下，可以正常的将内存分配到内存管理器当中使用，并无不妥。

倘若是使用高地址映射，如是在开启分页前将所有的内存管理起来，那么开启分页后，这些在前面获取到的内存地址就都是Low Vritual Address，这些地址并没有进行映射，我们只映射了高地址空间，那么我们后面想要分配内存的时候，如果是需要VA那么还需要我们自己手动使用Physical Address to Virtual Address转换到我们已经映射到区域，这样就很不方便了，所以使用bump_alloc就不会有这么多问题，会很方便。

`alt_axalloc`

alt_axalloc == Alternative Allocator

简单看一下，alt_axalloc的依赖，我们上面也提到了alt_axalloc依赖bump_alloc

// alt_axalloc/Cargo.toml
allocator = { git = "https://github.com/arceos-org/allocator.git", tag ="v0.1.0", features = ["bitmap"] }
bump_allocator = { path = "../bump_allocator" }

alt_alloc更多的是对bump_alloc的可用封装，并向外提供内存管理的功能，在这里并没有什么需要多说的地方。

`axalloc`

在src/lib.rs中实现的内存分配器主要的作用还是还是用来处理在rust中的内存分配，它是实现了Vec等数据结构所需的global_allocator，极其方法

// src/lib.rs

unsafe impl GlobalAlloc for GlobalAllocator {
    unsafe fn alloc(&self, layout: Layout) -> *mut u8 {
        if let Ok(ptr) = GlobalAllocator::alloc(self, layout) {
            ptr.as_ptr()
        } else {
            alloc::alloc::handle_alloc_error(layout)
        }
    }

    unsafe fn dealloc(&self, ptr: *mut u8, layout: Layout) {
        GlobalAllocator::dealloc(self, NonNull::new(ptr).expect("dealloc null ptr"), layout)
    }
}

在src/page.rs中实现的是页分配器，主要的作用还是用来进行地址映射，以及需要的大空间映射。

具体的实现可以参阅具体代码，并没有什么需要说明的部分。

`axmm`

基于axalloc的页表地址空间管理库

// axmm/Cargo.toml
[dependencies]
axhal = { workspace = true, features = ["paging"] }

// axhal/Cargo.toml
[features]
paging = ["axalloc", "page_table_multiarch"]

src
- backend/: 具体实现代码
  - alloc.rs: 包含使用axalloc来进行页级的映射地址，和取消映射
  - linear: 包含使用外部库进行连续的地址映射，支持页级映射和大页映射
  - mod.rs: 将alloc.rs和linear上的映射的具体实现，封装到MappingBackend trait中
- aspace.rs：基于backend封装的映射函数，实现的虚拟空间管理
- lib.rs: 包含创建新的用户空间，内核空间，映射内核空间等等

// axmm/src/backend/alloc.rs

fn alloc_frame(zeroed: bool) -> Option<PhysAddr> {
    let vaddr = VirtAddr::from(global_allocator().alloc_pages(1, PAGE_SIZE_4K).ok()?);
    if zeroed {
        unsafe { core::ptr::write_bytes(vaddr.as_mut_ptr(), 0, PAGE_SIZE_4K) };
    }
    let paddr = virt_to_phys(vaddr);
    Some(paddr)
}

alloc.rs通过使用全局分配器axalloc或alt_alloc的allloc_page来获取内存使用

// axmm/src/backend/mod.rs

#[derive(Clone)]
pub enum Backend {
    Linear {pa_va_offset: usize,},
    Alloc {populate: bool,},
}

impl MappingBackend for Backend {
    type Addr = VirtAddr;
    type Flags = MappingFlags;
    type PageTable = PageTable;
    fn map(&self, start: VirtAddr, size: usize, flags: MappingFlags, pt: &mut PageTable) -> bool {
        match *self {
            Self::Linear { pa_va_offset } => self.map_linear(start, size, flags, pt, pa_va_offset),
            Self::Alloc { populate } => self.map_alloc(start, size, flags, pt, populate),
        }
    }

    fn unmap(&self, start: VirtAddr, size: usize, pt: &mut PageTable) -> bool {
        match *self {
            Self::Linear { pa_va_offset } => self.unmap_linear(start, size, pt, pa_va_offset),
            Self::Alloc { populate } => self.unmap_alloc(start, size, pt, populate),
        }
    }
    ...
}

在mod.rs中，实现了MappingBackend trait，通过使用alloc.rs和linear.rs中的对应的映射函数完成。

而mod.rs中的MappingBackend trait又是为了memory_set库中的map_area和map服务的，也就是为AddrSpace中的areas: MemorySet<Backend> 服务，所涉及的代码如下：

// axmm/src/aspace.rs

pub struct AddrSpace {
    va_range: VirtAddrRange,
    areas: MemorySet<Backend>,
    pt: PageTable,
}

// axmm/src/aspace.rs

pub fn map_alloc(
        &mut self,
        start: VirtAddr,
        size: usize,
        flags: MappingFlags,
        populate: bool,
    ) -> AxResult {
...
        let area = MemoryArea::new(start, size, flags, Backend::new_alloc(populate));
        self.areas
            .map(area, &mut self.pt, false)
            .map_err(mapping_err_to_ax_err)?;
...
    }

其中：self.areas.map(area, &mut self.pt, false).map_err(mapping_err_to_ax_err)?;的map会调用map_area最后会调用我们所实现的Backend中的map函数

关于Backend实现的unmap函数，我并没有发现在什么地方使用，可能会在更深的地方调用

关于其他的调用建立新的页表，复制页表，寻找空闲空间，连续映射，页映射，取消映射，读地址，写地址等，就不再赘述了。

`axfs`

axfs可能是要介绍的这几个库中最麻烦的几个了。

整个axfs的核心都是在root.rs和fops.rs两个文件上

api:
- file.rs: 基于OpenOption::opne()及fops::File的文件的打开，写入，创建等操作。以及获取元数据等信息
- dir.rs：实现了文件系统中的目录操作，读取目录内容以及创建新目录
- mod.rs：向外提供目录的读取，创建，删除，文件的读取，写入，重命名等操作
fs:
- fatfs.rs： FAT文件系统
- myfs
- mod.rs
dev.rs：底层驱动的适配层
fops.rs：定义了文件，目录和打开的权限，以及基于ROOT_DIR及axvfs_ops的打开文件，读取，写入，刷新等操作
lib.rs：初始化文件系统
mounts.rs：各文件系统的挂载
root.rs：实现根目录的挂载及节点的相关操作，同时基于初始化完成后的ROOT_DIR提供获取绝对路径，搜索，创建，删除，重命名文件等功能

fops.rs我认为是首先需要查阅的

在fops.rs中定义了File和Directory结构体，以及文件打开后持有的权限OpenOption

// src/fops.rs
pub struct File {
    node: WithCap<VfsNodeRef>,
    is_append: bool,
    offset: u64,
}
pub struct Directory {
    node: WithCap<VfsNodeRef>,
    entry_idx: usize,
}

在结构体中需要注意的就是File和Directory都是持有node节点的，他们的所有的操作都是基于VfsNodeRef的

而在axvfs中pub type VfsNodeRef = Arc<dyn VfsNodeOps>;。

// src/fops.rs
impl File {
    ...
    fn access_node(&self, cap: Cap) -> AxResult<&VfsNodeRef> {
        self.node.access_or_err(cap, AxError::PermissionDenied)
    }
    ...
}

access_node就是获取节点的函数，后续涉及到vfs的操作(文件或目录操作)，都是需要先通过此函数获取对应的可操作节点。

// src/fops.rs
impl File {
    ...
    pub fn read(&mut self, buf: &mut [u8]) -> AxResult<usize> {
        let node = self.access_node(Cap::READ)?;
        let read_len = node.read_at(self.offset, buf)?;
        ...
        Ok(read_len)
    }
    pub fn read_at(&self, offset: u64, buf: &mut [u8]) -> AxResult<usize> {
        let node = self.access_node(Cap::READ)?;
        let read_len = node.read_at(offset, buf)?;
        ...
    }
    ...
}

所以在诸如此类node.read的代码中，他们的导向就是VFS的抽象，最终在运行时，由实际的文件系统提供此类操作以实现File或Directory中实现的功能

而Directory与File不同的是，Directory中的部分操作是直接关联的root.rs中的ROOT_DIR的，接下来我们再看root.rs

// src/root.rs
static CURRENT_DIR_PATH: Mutex<String> = Mutex::new(String::new());
static CURRENT_DIR: LazyInit<Mutex<VfsNodeRef>> = LazyInit::new();
struct MountPoint {
    path: &'static str,
    fs: Arc<dyn VfsOps>,
}
struct RootDirectory {
    main_fs: Arc<dyn VfsOps>,
    mounts: Vec<MountPoint>,
}

static ROOT_DIR: LazyInit<Arc<RootDirectory>> = LazyInit::new();

impl RootDirectory {
    pub const fn new(main_fs: Arc<dyn VfsOps>) -> Self 
    pub fn mount(&mut self, path: &'static str, fs: Arc<dyn VfsOps>) -> AxResult 
    pub fn _umount(&mut self, path: &str)
    pub fn contains(&self, path: &str) -> bool
    fn lookup_mounted_fs<F, T>(&self, path: &str, f: F) -> AxResult<T>
}

在实现的RootDirectory中，main_fs是主文件系统，在mounts中是挂载的文件系统，可以挂载多个，就像是U盘，临时的文件系统等

impl VfsNodeOps for RootDirectory {
    axfs_vfs::impl_vfs_dir_default! {}
    fn get_attr(&self) -> VfsResult<VfsNodeAttr>
    fn lookup(self: Arc<Self>, path: &str) -> VfsResult<VfsNodeRef>
    fn create(&self, path: &str, ty: VfsNodeType) -> VfsResult
    fn remove(&self, path: &str) -> VfsResult
    fn rename(&self, src_path: &str, dst_path: &str) -> VfsResult
}

在实现VfsNodeOps中，fs.root_dir()等操作是使用的VfsOps抽象，也就是由挂载的文件系统实现的VfsOps提供具体实现。

所以本质上在RootDirectory上实现的VfsNodeOps的调用路径就是

graph LR
    A[RootDirectory] -->|持有/管理| B[VfsOps]
    B -->|root_dir 方法产生| C[VfsNodeOps]
    C --> D[fs具体实现]

fn parent_node_of(dir: Option<&VfsNodeRef>, path: &str) -> VfsNodeRef {
    if path.starts_with('/') {
        ROOT_DIR.clone()
    } else {
        dir.cloned().unwrap_or_else(|| CURRENT_DIR.lock().clone())
    }
}

剩下的代码最重要的实现就是parent_node_of是专门用来获取解析的VfsNodeRef的基点，如果是/则是绝对路径，否则就是相对路径，给我们解析出对应的可用的VfsNodeRef

// src/api/file.rs
pub struct File {
    inner: fops::File,
}
pub struct OpenOptions(fops::OpenOptions);

impl OpenOptions {
    ...
    /// Opens a file at `path` with the options specified by `self`.
    pub fn open(&self, path: &str) -> Result<File> {
        fops::File::open(path, &self.0).map(|inner| File { inner })
    }
    ...
}

impl File {
    pub fn open(path: &str) -> Result<Self> 
    pub fn create(path: &str) -> Result<Self>
    pub fn create_new(path: &str) -> Result<Self>
    pub fn options() -> OpenOptions
    pub fn set_len(&self, size: u64) -> Result<()> 
    pub fn metadata(&self) -> Result<Metadata> 
}

在src/file.rs中，OpenOptions实现的函数除open外都是会返回自身的，所以最后在实现File的时候，是通过设置OpenOptions权限后，用OpenOptions::open进行打开文件。

而在src/api/dir.rs中的代码的核心作用就是实现目录迭代器和目录构造器，而当前的目录构造器中，只实现了create_dir

graph TD
    A[调用 ReadDir::next] --> B{缓冲区还有数据吗?}
    B -- 有 --> C[提取当前 buffer 索引的数据]
    B -- 没有 --> D[调用底层 fops::read_dir 填满 31 个位子]
    D --> E{读取到 0 个?}
    E -- 是 --> F[返回 None, 结束遍历]
    E -- 否 --> C
    C --> G{是 . 或 .. 吗?}
    G -- 是 --> A
    G -- 否 --> H[包装成 DirEntry 并返回]

启动示例

这里以ramfs_rename示例来讲解整个流程的启动

[features]
default = ["axstd/myfs", "dep:axfs_vfs", "dep:axfs_ramfs", "dep:crate_interface"]

[dependencies]
axfs_vfs = { version = "0.1", optional = true }
axfs_ramfs = { version = "0.1", optional = true }
crate_interface = { version = "0.1", optional = true }
axstd = { workspace = true, features = ["alloc", "fs"], optional = true }

这是示例文件的Cargo.toml，通过特性解析，Cargo会将对应的开启的特性进行编译，可以通过Cargo tree -p ramfs_rename来查看。

graph TD
    subgraph Build_Time [编译与链接阶段]
        A[Cargo Feature 解析] -->|Enabled: ramfs_rename| B[源码编译 & 依赖解析]
        B -->|Check: cargo tree -p ramfs_rename| C[生成目标文件 .o]
        C --> D[Linker Script: linker.lds.S]
        D -->|链接合并| E[内核二进制镜像]
    end

    subgraph Runtime_Boot [运行与初始化阶段]
        E --> F[".text.boot (Entry Point)"]
        F --> G["_start() 
(axhal/.../boot.rs)"]
        G -->|汇编级初始化| H["rust_entry 
(axhal/.../mod.rs)"]
        H -->|平台级 Rust 环境初始化| I["rust_main 
(axruntime/src/lib.rs)"]
        I --> J[操作系统核心逻辑启动]
    end

    %% Style
    style A fill:#f9f,stroke:#333
    style D fill:#bbf,stroke:#333
    style G fill:#dfd,stroke:#333
    style J fill:#f96,stroke:#333

在rust_main初始化过程中

fn init_allocator() {
    use axhal::mem::{memory_regions, phys_to_virt, MemRegionFlags};

    info!("Initialize global memory allocator...");
    info!("  use {} allocator.", axalloc::global_allocator().name());

    let mut max_region_size = 0;
    let mut max_region_paddr = 0.into();
    for r in memory_regions() {
        if r.flags.contains(MemRegionFlags::FREE) && r.size > max_region_size {
            max_region_size = r.size;
            max_region_paddr = r.paddr;
        }
    }
    for r in memory_regions() {
        if r.flags.contains(MemRegionFlags::FREE) && r.paddr == max_region_paddr {
            axalloc::global_init(phys_to_virt(r.paddr).as_usize(), r.size);
            break;
        }
    }
    for r in memory_regions() {
        if r.flags.contains(MemRegionFlags::FREE) && r.paddr != max_region_paddr {
            axalloc::global_add_memory(phys_to_virt(r.paddr).as_usize(), r.size)
                .expect("add heap memory region failed");
        }
    }
}

初始化全局分配器，首先找到标记为Free的最大的空闲区域，然后进行初始化，最后将所有的空闲的空间再全部加入到分配器中。

pub fn init_memory_management() {
    info!("Initialize virtual memory management...");

    let kernel_aspace = new_kernel_aspace().expect("failed to initialize kernel address space");
    debug!("kernel address space init OK: {:#x?}", kernel_aspace);
    KERNEL_ASPACE.init_once(SpinNoIrq::new(kernel_aspace));
    axhal::paging::set_kernel_page_table_root(kernel_page_table_root());
}

然后建立内核页表，进行内核代码映射，并开启分页

/// Initializes filesystems by block devices.
pub fn init_filesystems(mut blk_devs: AxDeviceContainer<AxBlockDevice>) {
    info!("Initialize filesystems...");

    let dev = blk_devs.take_one().expect("No block device found!");
    info!("  use block device 0: {:?}", dev.device_name());
    self::root::init_rootfs(self::dev::Disk::new(dev));
}

然后建立文件系统，在建立文件系统的时候，会调用init_rootfs，因为在本次的代码中，使用了myfs，所以会在

pub(crate) fn init_rootfs(disk: crate::dev::Disk) {
    cfg_if::cfg_if! {
        if #[cfg(feature = "myfs")] { // override the default filesystem
            let main_fs = fs::myfs::new_myfs(disk);
        } else if #[cfg(feature = "fatfs")] {
            static FAT_FS: LazyInit<Arc<fs::fatfs::FatFileSystem>> = LazyInit::new();
            FAT_FS.init_once(Arc::new(fs::fatfs::FatFileSystem::new(disk)));
            FAT_FS.init();
            let main_fs = FAT_FS.clone();
        }
    }
    ...
}

初始化myfs文件系统，而具体的myfs的代码实现

/// The interface to define custom filesystems in user apps.
#[crate_interface::def_interface]
pub trait MyFileSystemIf {
    /// Creates a new instance of the filesystem with initialization.
    ///
    /// TODO: use generic disk type
    fn new_myfs(disk: Disk) -> Arc<dyn VfsOps>;
}

pub(crate) fn new_myfs(disk: Disk) -> Arc<dyn VfsOps> {
    crate_interface::call_interface!(MyFileSystemIf::new_myfs(disk))
}

graph LR
    Kernel[内核/运行时核心] -->|调用助手函数| Helper[new_myfs]
    Helper -->|call_interface!| Bus[接口总线]
    subgraph App_or_Other_Crate [具体实现层]
        Impl[某个具体的文件系统实现] --实现--> Interface(MyFileSystemIf)
    end
    Bus -.->|寻找实现者| Impl
    Impl -->|返回| Res[Arc<dyn VfsOps>]

在本次使用的代码中使用了

struct MyFileSystemIfImpl;

#[crate_interface::impl_interface]
impl MyFileSystemIf for MyFileSystemIfImpl {
    fn new_myfs(_disk: AxDisk) -> Arc<dyn VfsOps> {
        Arc::new(RamFileSystem::new())
    }
}

所以直接初始化自定义的ramfs

最后运行main，也就是链接的我们的APP的main函数

graph TD
    Start([Start rust_main]) --> Alloc[1. init_allocator: Heap Initialization]

    subgraph Mem_Alloc [Memory Allocator Init Details]
        Alloc --> Scan[Scan memory_regions for FREE regions]
        Scan --> Max[Find max_region]
        Max --> GlobalInit["global_init(max_region) 
Base heap address"]
        GlobalInit --> AddOthers["global_add_memory(others) 
Collect remaining free blocks"]
    end

    AddOthers --> Paging[2. init_memory_management: VM Management]

    subgraph VM_Init [Virtual Memory & Paging]
        Paging --> AS["new_kernel_aspace() 
Setup kernel mapping"]
        AS --> SetPT["set_kernel_page_table_root() 
Enable paging"]
    end

    SetPT --> FS[3. init_filesystems: FS Initialization]

    subgraph FS_Logic [Filesystem Mount Logic]
        FS --> TakeDev[Get block device: blk_devs.take_one]
        TakeDev --> InitRoot["init_rootfs(Disk::new(dev))"]

        InitRoot --> Feature{"Feature 'myfs' Enabled?"}
        Feature -- Yes --> CallIf["fs::myfs::new_myfs(disk)"]

        subgraph Interface_Call [crate_interface Dispatch Layer]
            CallIf --> Macro["call_interface!(MyFileSystemIf)"]
            Macro -.->|Static Link / Dispatch| Impl["MyFileSystemIfImpl::new_myfs"]
            Impl --> RamFS["Arc::new(RamFileSystem::new()) 
Init Custom RamFS"]
        end

        RamFS --> MainFS["Get main_fs"]
    end

    MainFS --> AppMain([4. Run main: Enter App Entry])

    %% Styles
    style Alloc fill:#f9f,stroke:#333
    style Paging fill:#bbf,stroke:#333
    style FS fill:#dfd,stroke:#333
    style Interface_Call fill:#fff4dd,stroke:#d4a017,stroke-dasharray: 5 5
    style AppMain fill:#f96,stroke:#333,stroke-width:2px

正常启动完成后，开始运行代码

#![cfg_attr(feature = "axstd", no_std)]
#![cfg_attr(feature = "axstd", no_main)]

#[macro_use]
#[cfg(feature = "axstd")]
extern crate axstd as std;

mod ramfs;

use std::fs::{self, File};
use std::io::{self, prelude::*};

fn create_file(fname: &str, text: &str) -> io::Result<()> {
    println!("Create '{}' and write [{}] ...", fname, text);
    let mut file = File::create(fname)?;
    file.write_all(text.as_bytes())
}

// Only support rename, NOT move.
fn rename_file(src: &str, dst: &str) -> io::Result<()> {
    println!("Rename '{}' to '{}' ...", src, dst);
    fs::rename(src, dst)
}

fn print_file(fname: &str) -> io::Result<()> {
    let mut buf = [0; 1024];
    let mut file = File::open(fname)?;
    loop {
        let n = file.read(&mut buf)?;
        if n > 0 {
            print!("Read '{}' content: [", fname);
            io::stdout().write_all(&buf[..n])?;
            println!("] ok!");
        } else {
            return Ok(());
        }
    }
}

fn process() -> io::Result<()> {
    create_file("/tmp/f1", "hello")?;
    // Just rename, NOT move.
    // So this must happen in the same directory.
    rename_file("/tmp/f1", "/tmp/f2")?;
    print_file("/tmp/f2")
}

#[cfg_attr(feature = "axstd", no_mangle)]
fn main() {
    if let Err(e) = process() {
        panic!("Error: {}", e);
    }
    println!("\n[Ramfs-Rename]: ok!");
}

因为我们本次的任务就是实现rename的调用

如果我们跟踪rename的整个调用链的话，我们可以看到的流程：

graph TD
    subgraph User_Space [用户态 / User Space]
        A["axstd::fs::rename(old, new)"] -->|Standard Library Wrapper| B["arceos_api::fs::ax_rename(old, new)"]
    end

    subgraph API_Gateway [API 转换层 / API Layer]
        B -->|System Call-like Interface| C["arceos::fs::ax_rename(old, new)"]
    end

    subgraph Kernel_Core [内核核心 / Kernel Core]
        C -->|Kernel Dispatch| D["axfs::api::rename(old, new)"]
    end

    subgraph File_System_Component [文件系统组件 / FS Component]
        D -->|Path Lookup & Logic| E["axfs/src/root/mod.rs (rename)"]
        E -->|VFS Node Operation| F["VfsNodeOps::rename"]
    end

    %% Styles
    style A fill:#f9f,stroke:#333
    style B fill:#e1f5fe,stroke:#01579b
    style C fill:#fff4dd,stroke:#d4a017
    style D fill:#e8f5e9,stroke:#2e7d32
    style E fill:#fbe9e7,stroke:#c62828

最后调用的是VfsNodeOps的抽象，而我们在这个阶段使用的文件系统是ramfs在axfs_ramfs

我们再详细看一下axfs中关于rename的调用链

// axfs/src/root.rs
impl VfsNodeOps for RootDirectory {
    ...
    fn rename(&self, src_path: &str, dst_path: &str) -> VfsResult {
        self.lookup_mounted_fs(src_path, |fs, rest_path| {
            if rest_path.is_empty() {
                ax_err!(PermissionDenied) // cannot rename mount points
            } else {
                fs.root_dir().rename(rest_path, dst_path)
            }
        })
    }
}

fn parent_node_of(dir: Option<&VfsNodeRef>, path: &str) -> VfsNodeRef {
    if path.starts_with('/') {
        ROOT_DIR.clone()
    } else {
        dir.cloned().unwrap_or_else(|| CURRENT_DIR.lock().clone())
    }
}

pub(crate) fn rename(old: &str, new: &str) -> AxResult {
    if parent_node_of(None, new).lookup(new).is_ok() {
        warn!("dst file already exist, now remove it");
        remove_file(None, new)?;
    }
    parent_node_of(None, old).rename(old, new)
}

因为在ROOT_DIR上挂载的是文件系统，所以，会调用VfsOps的root_dir抽象(由ramfs实现)，所以rename和root_dir的具体实现都在ramfs中

// axfs_ramfs/src/lib.rs
pub struct RamFileSystem {
    parent: Once<VfsNodeRef>,
    root: Arc<DirNode>,
}
impl VfsOps for RamFileSystem {
    ...
    fn root_dir(&self) -> VfsNodeRef {
        self.root.clone()
    }
}

在具体的实现中我们可以看到，是DirNode实现了rename的操作

// axfs_ramfs/src/dir.rs
pub struct DirNode {
    this: Weak<DirNode>,
    parent: RwLock<Weak<dyn VfsNodeOps>>,
    children: RwLock<BTreeMap<String, VfsNodeRef>>,
}

impl VfsNodeOps for DirNode {
    ...
    fn rename(&self, src_path: &str, dst_path: &str) -> VfsResult {
        log::warn!("rename at ramfs: {} -> {}", src_path, dst_path);
        let (src_name, src_rest) = split_path(src_path);
        log::warn!(
            "src_name: {}, src_rest: {}",
            src_name,
            src_rest.unwrap_or("")
        );
        if let Some(rest) = src_rest {
            match src_name {
                // recurse on self with the remaining path.
                "" | "." => self.rename(rest, dst_path),
                // get the parent node and recurse.
                ".." => self
                    .parent()
                    .ok_or(VfsError::NotFound)?
                    .rename(rest, dst_path),
                // find the child node and recurse.
                _ => {
                    let child_dir = self
                        .children
                        .read()
                        .get(src_name)
                        .cloned()
                        .ok_or(VfsError::NotFound)?;
                    child_dir.rename(rest, dst_path)
                }
            }
        } else {
            let dst_name = dst_path.rsplit('/').next().unwrap();

            if src_name.is_empty() || src_name == "." || src_name == ".." {
                return Err(VfsError::InvalidInput);
            }
            if dst_name.is_empty() || dst_name == "." || dst_name == ".." {
                return Err(VfsError::InvalidInput);
            }

            let mut child = self.children.write();
            let nodeops = child.remove(src_name).ok_or(VfsError::NotFound)?;
            child.insert(dst_name.into(), nodeops);

            Ok(())
        }

        // Ok(())
    }

    axfs_vfs::impl_vfs_dir_default! {}
}

因为rename是属于VfsNodeOps的抽象，所以我们补上这个缺失的函数即可。

AuroBreeze Blog

ArceOS Architecture Analysis