Fast Api最佳实践指南

type

status

date

slug

summary

项目结构

项目结构有很多种，但最好的结构是一致、直观且没有意外的。

许多示例项目和教程按文件类型（如crud、routers、models）划分项目，这种方式对于微服务或范围较小的项目很有效。但是，这种方法并不适合我们这个包含许多领域和模块的单体应用。

我发现对于这类情况，更具可扩展性和可演进性的结构是受Netflix的Dispatch启发，并做了一些小修改。

src/ - 应用的最高级别，包含通用模型、配置和常量等。
src/main.py - 项目的根文件，用于初始化FastAPI应用

每个包都有自己的路由、模式、模型等。

router.py - 每个模块的核心，包含所有端点
schemas.py - 用于pydantic模型
models.py - 用于数据库模型
service.py - 模块特定的业务逻辑
dependencies.py - 路由依赖项
constants.py - 模块特定的常量和错误代码
config.py - 例如环境变量
utils.py - 非业务逻辑函数，例如响应规范化、数据丰富等
exceptions.py - 模块特定的异常，例如PostNotFound、InvalidUserData

当包需要其他包的服务、依赖项或常量时，使用显式的模块名导入

异步路由

FastAPI首先是一个异步框架。它设计用于处理异步I/O操作，这也是它如此快速的原因。

然而，FastAPI并不限制你只能使用async路由，开发者也可以使用同步路由。这可能会让初学者误以为它们是一样的，但实际上并非如此。

I/O密集型任务

在底层，FastAPI可以有效地处理异步和同步I/O操作。

FastAPI在线程池中运行同步路由，阻塞的I/O操作不会阻止事件循环执行任务。

如果路由定义为async，那么它会通过await正常调用，FastAPI相信你只会执行非阻塞的I/O操作。

需要注意的是，如果你违反了这种信任，在异步路由中执行阻塞操作，事件循环将无法在阻塞操作完成之前运行后续任务。

当我们调用时会发生什么：

GET /terrible-ping

FastAPI服务器接收请求并开始处理
服务器的事件循环和队列中的所有任务都将等待time.sleep()完成

服务器认为time.sleep()不是I/O任务，所以会等待它完成
等待期间，服务器不会接受任何新请求

服务器返回响应。

响应之后，服务器开始接受新请求

GET /good-ping

FastAPI服务器接收请求并开始处理
FastAPI将整个路由good_ping发送到线程池，工作线程将在那里运行该函数
在good_ping执行期间，事件循环从队列中选择下一个任务并处理它们（例如接受新请求、调用数据库）

独立于主线程（即我们的FastAPI应用），工作线程将等待time.sleep完成。

同步操作只阻塞子线程，而不是主线程。

当good_ping完成工作后，服务器向客户端返回响应

GET /perfect-ping

FastAPI服务器接收请求并开始处理
FastAPI等待asyncio.sleep(10)
事件循环从队列中选择下一个任务并处理它们（例如接受新请求、调用数据库）
当asyncio.sleep(10)完成后，服务器完成路由的执行并向客户端返回响应

[!WARNING] 关于线程池的注意事项：
线程比协程需要更多资源，因此它们不像异步I/O操作那样轻量。
线程池的线程数量是有限的，也就是说，你可能会耗尽线程，导致应用变慢。了解更多（外部链接）

CPU密集型任务

第二个需要注意的是，非阻塞的可等待对象或发送到线程池的操作必须是I/O密集型任务（例如打开文件、数据库调用、外部API调用）。

等待CPU密集型任务（例如繁重的计算、数据处理、视频转码）是没有意义的，因为CPU必须工作才能完成这些任务，而I/O操作是外部的，服务器在等待这些操作完成时什么也不做，因此它可以处理下一个任务。

在其他线程中运行CPU密集型任务也不是有效的，因为GIL（全局解释器锁）的存在。简而言之，GIL只允许一个线程同时工作，这使得它对CPU任务毫无用处。

如果你想优化CPU密集型任务，你应该将它们发送到另一个进程中的工作节点。

困惑用户的相关StackOverflow问题

https://stackoverflow.com/questions/62976648/architecture-flask-vs-fastapi/70309597#70309597

在这里你也可以查看我的回答

https://stackoverflow.com/questions/65342833/fastapi-uploadfile-is-slow-compared-to-flask

https://stackoverflow.com/questions/71516140/fastapi-runs-api-calls-in-serial-instead-of-parallel-fashion

Pydantic

大量使用Pydantic

Pydantic有丰富的功能来验证和转换数据。

除了常规功能（如带有默认值的必填和非必填字段），Pydantic还有内置的综合数据处理工具，如正则表达式、枚举、字符串操作、电子邮件验证等。

自定义基础模型

拥有一个可控制的全局基础模型允许我们自定义应用中的所有模型。例如，我们可以强制使用标准的 datetime 格式，或者为基础模型的所有子类引入一个通用方法。

在上面的例子中，我们决定创建一个全局基础模型，它：

将所有datetime字段序列化为具有显式时区的标准格式

提供一个方法来返回仅包含可序列化字段的字典

拆分Pydantic BaseSettings

BaseSettings是读取环境变量的一项伟大创新，但为整个应用使用单个BaseSettings随着时间的推移可能会变得混乱。为了提高可维护性和组织性，我们将BaseSettings拆分到不同的模块和领域中。

依赖项

超越依赖注入

Pydantic是一个很棒的模式验证器，但对于涉及调用数据库或外部服务的复杂验证，它还不够。

FastAPI文档主要将依赖项展示为端点的依赖注入，但它们也非常适合请求验证。

依赖项可用于根据数据库约束验证数据（例如，检查电子邮件是否已存在、确保找到用户等）。

如果我们没有将数据验证放入依赖项中，我们将不得不为每个端点验证post_id是否存在，并为每个端点编写相同的测试。

链式依赖

依赖项可以使用其他依赖项，避免类似逻辑的代码重复。

拆分并复用依赖项。依赖调用会被缓存

依赖项可以多次复用，并且它们不会被重新计算——FastAPI默认在请求的范围内缓存依赖项的结果，也就是说，如果valid_post_id在一个路由中被多次调用，它只会被调用一次。

了解这一点后，我们可以将依赖项拆分为多个更小的函数，这些函数在更小的领域上运行，并且更容易在其他路由中复用。

例如，在下面的代码中，我们三次使用parse_jwt_data：

valid_owned_post

valid_active_creator

get_user_post

但parse_jwt_data只在第一次调用时被调用一次。

优先使用`async`依赖项

FastAPI同时支持同步和异步依赖项，当你不需要等待任何东西时，很容易会想使用同步依赖项，但这可能不是最佳选择。

与路由一样，同步依赖项在线程池中运行。这里的线程也有代价和限制，如果只是进行小的非I/O操作，这些代价和限制是多余的。

了解更多（外部链接）

其他

遵循REST规范

开发RESTful API可以更轻松地在如下路由中复用依赖项：

GET /courses/:course_id

GET /courses/:course_id/chapters/:chapter_id/lessons

GET /chapters/:chapter_id

唯一需要注意的是必须在路径中使用相同的变量名：

如果你有两个端点GET /profiles/:profile_id和GET /creators/:creator_id，它们都验证给定的profile_id是否存在，但GET /creators/:creator_id还检查该个人资料是否是创作者，那么最好将creator_id路径变量重命名为profile_id并链接这两个依赖项。

FastAPI响应序列化

你可能认为可以返回与路由的response_model匹配的Pydantic对象来进行一些优化，但你错了。

FastAPI首先使用其jsonable_encoder将该pydantic对象转换为字典，然后使用你的response_model验证数据，最后才将你的对象序列化为JSON。

这意味着你的Pydantic模型对象会被创建两次：

第一次，当你显式创建它以从路由返回时。

第二次，FastAPI隐式创建它以根据response_model验证响应数据。

日志输出：

如果必须使用同步SDK，请在线程池中运行它。

如果你必须使用一个库与外部服务交互，并且它不是异步的，那么在外部工作线程中进行HTTP调用。

我们可以使用starlette中著名的run_in_threadpool。

ValueErrors可能会变成Pydantic ValidationError

如果你在直接面向客户端的Pydantic模式中引发ValueError，它将向用户返回一个详细的响应。

响应示例：

文档

除非你的API是公共的，否则默认隐藏文档。只在选定的环境中显式显示它。

帮助FastAPI生成易于理解的文档

设置response_model、status_code、description等。
如果模型和状态不同，使用responses路由属性为不同的响应添加文档

将生成如下文档：

设置数据库键命名约定

根据数据库的约定显式设置索引命名比使用sqlalchemy的默认命名方式更好。

迁移工具Alembic

迁移必须是静态的且可回滚的。如果你的迁移依赖于动态生成的数据，那么确保只有数据本身是动态的，而不是其结构。

生成具有描述性名称和slug的迁移。slug是必需的，应该解释所做的更改。

为新迁移设置人类可读的文件模板。我们使用date*_*slug*.py模式，例如2022-08-24_post_content_idx.py

设置数据库键命名约定

保持名称的一致性很重要。我们遵循的一些规则：

小写蛇形命名（lower_case_snake）

单数形式（例如post、post_like、user_playlist）

用模块前缀对类似的表进行分组，例如payment_account、payment_bill、post、post_like

在表之间保持一致，但具体命名也可以，例如

在所有表中使用profile_id，但如果其中一些表只需要作为创作者的个人资料，则使用creator_id
在post_like、post_view等抽象表中使用post_id，但在相关模块中使用具体命名，如chapters.course_id中的course_id

datetime类型字段使用_at后缀

date类型字段使用_date后缀

SQL优先，Pydantic次之

通常，数据库处理数据的速度比CPython快得多，也更简洁。

最好使用SQL进行所有复杂的连接和简单的数据操作。

最好在数据库中为具有嵌套对象的响应聚合JSON。

从一开始就设置异步测试客户端

使用数据库编写集成测试很可能在将来导致混乱的事件循环错误。立即设置异步测试客户端，例如httpx

除非你有同步数据库连接（抱歉？）或者不打算编写集成测试。

使用ruff

有了代码检查工具，你可以忘记代码格式化，专注于编写业务逻辑。

Ruff是一个“速度极快”的新代码检查工具，它替代了black、autoflake、isort，并支持600多个检查规则。

使用pre-commit钩子是一种流行的最佳实践，但对我们来说，只使用脚本就足够了。

额外部分

一些非常善良的人分享了他们自己的经验和最佳实践，绝对值得一读。

查看项目的issues（问题）部分。

例如，lowercase00详细描述了他们在权限和认证、基于类的服务和视图、任务队列、自定义响应序列化器、使用dynaconf进行配置等方面的最佳实践。

如果你有关于使用FastAPI的经验要分享，无论是好是坏，都非常欢迎创建一个新的issue。我们很乐意阅读它。

目录

项目结构