AI 时代笔记软件的隐私性

标题引自:笔记软件的隐私性

下载一款笔记软件,再装一个 AI 插件,填上 API Key,授予读取权限,弄完就能让 AI 使用笔记了。问一句「总结这周的日记」,它找到你刚刚申请 API 时保存在笔记里的 key 并上传到模型运行的服务器。

哦嚯,密码泄露。

最好的方式似乎是数据完全留在本地,这基本就是不少把「隐私保护」当作流行词乱用的软件所做的程度。

然而真正考虑到隐私,必然需要考虑到数据录入、保存、传输整个环节。

① 输入法:字还没进笔记软件,输入法先看到。听说某某语音输入法很准确,连声音都要去云端转一圈。

② 剪贴板:从网页复制一段话,弹窗提醒「某某 App 读取了你的剪贴板」。

③ 应用锁定密码:防不住懂技术的人,却是普通用户唯一能直接感知到的隐私功能。

④ 本地数据加密:本地笔记文件不加密的话,.md​、.db​任何人拿到硬盘就能打开。

⑤加密传输:HTTPS/TLS 防中间人监听。

⑥云端存储:涉及云端存储,包括 S3 同步,如果存储的数据不加密,你的笔记就是服务商高权限员工茶余饭后的读物。

再说回 AI,在可见的未来,最好的模型必然运行在云端。算力门槛、模型体积、推理成本,每一条都决定了最强的 AI 不可能塞进一台个人电脑。

如果想要享受到 AI 的红利,只能把自己的数据交出去。

OpenAI 说不拿 API 数据训练模型。maybe。第三方中转呢。隐私不能靠法律和道德。

当 AI 成了基建,AI 功能的权限系统一定是设计必须考虑的东西。读写权限、操作范围、调用工具……

这点和「笔记加密」「笔记本加密」可以是一回事,只是对象现在是 AI。

我看到思源笔记最近做语义搜索就考虑到使用 embeddingignore 配置需要忽略被向量化的笔记。又走在前面了呀。