Ubuntu 用户与权限管理指南

Ubuntu 用户与权限管理指南

Ubuntu 的用户与权限系统是 Linux 安全模型的核心,基于 DAC(自主访问控制) + sudo 特权提升 + AppArmor/MAC 补充。理解它能帮你避免 90% 的“权限拒绝”“sudo 失效”“误删系统文件”等常见生产事故。 本文针对 Ubuntu 24.04 LTS / 26.04 LTS(主流服务器版本),聚焦本地用户管理(/etc/passwd & /etc/group),不涉及 LDAP/AD/SSSD 等企业级集中认证。 1. 核心概念速览 用户(User):每个进程都运行在某个用户身份下。UID 0 = root(全权),普通用户 UID ≥ 1000(Ubuntu 默认从 1000 开始)。 组(Group):用户可属于多个组,主组(primary group)通常与用户名同名,补充组(supplementary groups)决定额外权限。 文件权限:rwx(读/写/执行) × 拥有者 / 所属组 / 其他用户。八进制:7=rwx, 6=rw-, 4=r– 等。 sudo:允许普通用户以 root 或其他身份执行命令。Ubuntu 默认把初始用户加入 sudo […]

Ubuntu 系统目录结构详解(基于 FHS 标准)

Ubuntu(以及几乎所有主流 Linux 发行版)严格遵循 Filesystem Hierarchy Standard (FHS),这是 Linux Foundation 维护的文件系统层次结构标准(最新正式版为 3.0,2015 年发布,后续由 freedesktop.org 等组织维护与小幅更新)。FHS 的核心设计目标是: 统一不同发行版的文件布局,便于软件移植、文档编写和系统管理 区分可共享 / 不可共享、静态 / 可变 文件,支持网络文件系统(NFS)、只读挂载 /usr 等高级场景 保持根文件系统(/)尽可能小且包含启动、恢复所需的一切 所有文件和目录都从单一的根目录 / 开始,没有 Windows 式的 C:、D: 盘符。以下按重要性与使用频率,从根目录开始逐一详解 Ubuntu 24.04 LTS / 26.04 LTS 中的典型目录结构(实际内容可能因安装的软件包略有差异)。 核心目录一览表(FHS 要求 + Ubuntu 常见实践) 目录 是否必须在根分区 主要内容类型 可共享? 可变? 典型用途与注意事项 / 是 整个文件系统根 — — […]

Ubuntu 服务器基础操作

用了多年 Ubuntu Server,从 16.04 到现在的 24.04 LTS,再到即将到来的 26.04 LTS(预计 2026 年 4 月发布),积累了一些日常最常使用的操作方式。这些内容聚焦命令行环境下的核心任务,结合实际生产场景,加入一些理论背景和容易忽略的细节,帮助快速建立可靠的操作习惯。 Ubuntu 24.04 LTS 目前仍是生产主力(支持至 2029 年,可通过 Ubuntu Pro 延长至 2036 年左右),内核基于 6.8 系列,包管理器 apt 继续优化,systemd 深度集成,安全特性如 AppArmor 默认更严格,unattended-upgrades 更智能。26.04 LTS 将带来进一步的现代化,例如更多 Rust 组件替换传统工具、增强的 TPM 加密支持,以及对 Wayland 和现代硬件的更好适配(服务器端主要受益于内核和安全栈升级)。 1. 初次登录后的快速定位与基础环境感知 登录后第一时间运行以下命令,建立对系统的直观认知: whoami 与 id:确认当前用户身份及所属组,避免在错误权限下操作。 hostnamectl 与 hostname -I:查看主机名、内核版本、架构及所有 IP 地址(云厂商常把公网 IP 放在 metadata […]

Linux 服务器性能排查案例分析

以下是 2024–2026 年期间线上真实遇到过的几种典型性能问题案例,按出现频率从高到低排列。每案例都包含: 告警/现象描述 第一波指标快照(当时看到的典型数值) 排查路径(实际走的顺序) 根因分析 最终解决方案 复盘学到的关键教训 案例 1 – 最经典:日志狂写导致 iowait 爆炸(占比最高) 告警现象 Prometheus 告警:iowait > 40% 持续 10 分钟 业务方反馈:接口平均延迟从 30ms → 800ms–2s,P99 飙到 8–12 秒 机器负载:24 核,load average 45–60 第一波快照(大致数值) text uptime 12:34:56 up 45 days, load average: 52.3, 48.7, 46.1 iostat -x 1 5 Device r/s w/s rkB/s wkB/s […]

Linux 服务器性能优化基础实践

性能优化从来不是“一招鲜”,而是一套分层、优先级明确的系统性动作。 以下内容聚焦真正能带来 30%~300% 提升、性价比最高的基础实践,按照“投入产出比”从高到低排序,适合绝大多数中小型业务服务器(8–64 核,32–256GB 内存,NVMe SSD 或云盘)。 优化优先级排序原则(建议严格按此顺序执行) 解决最明显的资源瓶颈(iowait、swap、脏页、连接堆积) 调整最容易改、收益最大的系统参数 优化日志与写模式(往往能下降 50–90% 的 IO 压力) 数据库/缓存基础调优 应用层小幅调整(线程池、GC、连接池) 容器/虚拟化层隔离与限流 硬件/架构升级(最后考虑) 一、最高优先级:消除“假高负载”与最明显瓶颈(通常能提升 50–300%) 优化项 为什么有效(常见提升幅度) 推荐操作(按重要性排序) 预期效果(经验值) 注意事项 / 风险点 日志级别从 debug → info/warn 日志占 IO 50–90% 的极端案例极多 所有组件统一改成 info 或 warn(nginx、应用、java log4j2/logback、spring boot) iowait 下降 30–80%,延迟降低 20–70% 确认业务关键日志已输出到单独通道 异步日志 / 缓冲日志 同步写日志是最大元凶之一 log4j2 AsyncAppender、logback AsyncAppender、nginx […]

Linux 服务器 D 状态进程排查与处理

D 状态(也叫 uninterruptible sleep、Disk sleep)是 Linux 进程状态中最让人头疼的一种。一旦出现大量或持续的 D 状态进程,通常意味着系统正经历严重的阻塞,最常见的表现就是: load average 异常高 iowait / wa 显著升高 响应变慢甚至假死(ssh 卡顿、命令迟迟无返回) top/htop 里看到大量进程状态为 D 一、D 状态到底是什么?(内核视角) 在 Linux 任务(task_struct)中,进程状态(task->state)有几种主要取值: R → Running / Runnable(可运行或正在运行) S → Interruptible sleep(可被信号中断的睡眠,例如等待网络、锁、sleep) D → Uninterruptible sleep(不可被信号中断的睡眠) T → Stopped(被 SIGSTOP 暂停) Z → Zombie(僵尸进程) D 状态的核心定义: 进程正在等待内核中某个 不可中断 的 I/O 操作完成,且故意不响应任何信号(包括 SIGKILL),直到该 […]

Linux 服务器 IO wait 高意味着什么

iowait(也叫 %wa 或 %iowait)是 Linux 性能监控中最容易被误读、但又最有诊断价值的指标之一。 一、iowait 到底是什么?(内核视角) 在 Linux 的 CPU 时间统计中,每一秒的 CPU 时间都会被拆分成以下几类: %usr:用户态进程消耗的 CPU 时间 %sys:内核态(系统调用、调度、驱动等)消耗的 CPU 时间 %idle:CPU 完全空闲,没有任何任务可执行 %iowait:CPU 处于空闲状态,但有进程在等待磁盘 I/O 完成,无法被调度执行其他任务的时间占比 %irq / %soft:硬中断 / 软中断处理时间 %steal(虚拟化可见):被 hypervisor 偷走的时间 最核心的一句话: iowait 高 ≠ 磁盘很忙 iowait 高 = 有进程在等待磁盘 I/O 完成,而 CPU 此时无事可做 换句话说: iowait 是 CPU 的“无聊等待时间”,它本质上是 进程在 D […]

Linux 服务器性能问题排查常用工具汇总

以下工具清单不仅列出命令,还会深入说明每个工具背后依赖的内核机制、数据来源、采样原理、开销影响、适用场景边界以及常见误区,帮助你从“会用”升级到“懂为什么这么用”。 1. 基础工具(内核数据直接暴露层) 工具 内核机制 / 数据来源 采样/刷新原理 开销级别 典型误区与注意事项 深度使用技巧示例 top / htop /proc/[pid]/stat、/proc/stat、/proc/meminfo 1秒(默认)轮询读取 procfs ★☆☆☆☆ 误把 page cache 当成“内存泄漏”;htop 默认不显示线程 htop → F2 → Display options → Detailed CPU time(显示 us/sy/hi/si/wa/st) vmstat /proc/stat、/proc/vmstat、/proc/diskstats 内核计数器差值计算(可指定间隔) ★☆☆☆☆ 只看 wa 列就下结论;忽略 si/so 与 cs 的关联 vmstat 1 5 | awk ‘NR>2 {print $15 ” ” […]

Linux 服务器性能监控指标详解

性能监控的核心目标不是“把所有指标都收集起来”,而是用最少的指标、在最早的时间点发现问题、在最短的时间内定位到最可能的资源瓶颈。 以下是目前生产环境中(尤其云原生、容器化、微服务场景)最常使用、最有诊断价值的指标体系,按资源类型分类,每项都说明: 指标含义 采集来源(/proc、sysfs、工具) 关键阈值 / 异常表现(经验参考) 它真正能告诉你什么(诊断价值) 对应最常见的根因 1. CPU 相关核心指标 指标名称 来源 / 命令 含义与计算方式 关键阈值(经验) 诊断价值与常见根因 load average (1/5/15min) uptime /proc/loadavg 过去 1/5/15 分钟内处于 Running 或 Uninterruptible 的任务平均数 > 核数×1.5–2.0 开始关注 > 核数×3.0 严重过载 综合压力最直观指标;高但 CPU 使用率低 → 大量等待(IO/锁/网络) %usr + %sys top / mpstat / sar -u 用户态 + 内核态 CPU […]

Linux 服务器进程占用过高如何定位

“进程占用过高”通常指以下几种情况之一(按严重程度排序): 某个进程 CPU 使用率持续很高(单核/多核接近 100%) 某个进程内存占用(RSS / VSZ)持续线性增长或占比异常大 某个进程打开的文件描述符(fd)数量爆炸 某个进程产生大量磁盘 IO、线程数过多、上下文切换爆炸等间接导致系统整体变慢 以下是目前最常用、最有效的一套分层定位流程,从 30 秒粗筛到深度分析,通常 5–30 分钟内可以锁定主要嫌疑进程和原因类型。 第一步:30 秒粗筛 顺序 命令 看什么(异常阈值参考) 指向的方向 1 top 或 htop 按 P 看 %CPU,按 M 看 %MEM,按 1 看多核均衡性 CPU / 内存 Top 进程 2 ps -eo pid,ppid,%cpu,%mem,rss,vsz,comm –sort=-%cpu | head -15 %cpu、rss(驻留内存 KB)、vsz(虚拟内存 KB) CPU / 内存 Top […]

Telegram
Telegram服务器销售@IDCSELL