构建支持SAML联邦认证与JWT租户隔离的PWA全文检索架构

后端架构

文章字数: 3.4k

阅读时长: 14 分

在一个面向企业的（B2B）多租户SaaS平台中，身份认证与数据隔离是两条不可逾越的红线。当需求演变为需要集成客户的身份提供商（IdP）并通过SAML实现单点登录（SSO），同时在应用内部提供毫秒级的全文检索能力时，架构的复杂性便呈指数级增长。核心挑战在于，如何将来自外部联邦认证体系的身份信任链，安全地传递到内部的一个高性能、独立的搜索引擎（如Meilisearch），并确保每一次查询都受到严格的租户边界限制。

问题的关键在于，Meilisearch本身通过API密钥进行认证，它对SAML或JWT一无所知。一个错误的设计可能导致灾难性的数据泄露，即一个租户的用户能够检索到另一个租户的数据。

方案A：应用层过滤（The Naive Approach）

最初的构想最为直接：后端服务使用一个高权限的Meilisearch Master Key。当API请求携带用户的JWT到达时，后端验证JWT，解析出tenant_id，然后向Meilisearch发起一个不带任何过滤条件的查询。数据返回到后端服务后，再由应用代码根据tenant_id进行过滤，最后将过滤后的结果返回给前端。

// /routes/search.js - 方案A的伪代码实现
// !!! 警告：这是一个反模式，存在严重的安全和性能问题 !!!
import { meiliClient } from './meili-admin-client'; // 使用Master Key初始化的客户端

router.get('/search', authenticateJwt, async (req, res) => {
  try {
    const { tenant_id } = req.user; // 从已验证的JWT中获取租户ID
    const { query } = req.query;

    // 1. 使用高权限Key，查询所有文档
    const allResults = await meiliClient.index('documents').search(query, {
        limit: 1000 // 尝试获取足够多的数据以供过滤，这本身就是个问题
    });

    // 2. 在应用内存中进行过滤
    const tenantResults = allResults.hits.filter(hit => hit.tenant_id === tenant_id);

    res.json({ hits: tenantResults });
  } catch (error) {
    // ... 错误处理
  }
});

这种方案的弊端显而易见：

安全漏洞: 过滤逻辑一旦出现bug，哪怕只是一个==写成=的微小失误，都将导致所有租户数据泄露。
性能灾难: 必须从Meilisearch获取远超用户所需的数据量，然后在应用服务器的内存中进行过滤。随着数据量的增长，这将迅速耗尽服务器内存和CPU，并使得查询延迟变得不可接受。
权限过大: 后端服务持有Master Key，违反了最小权限原则。如果该服务被攻破，整个搜索引擎的数据都将面临风险。

此方案在原型阶段就被否决。

方案B：持久化租户特定密钥（Tenant-Specific Persistent Keys）

第二个方案是为每个租户生成一个专属的Meilisearch API Key。这个Key在创建时就被配置为只能访问特定租户的数据。通常，这通过创建租户专属的索引（例如 documents_tenant_A）或使用过滤规则来实现。

// 创建一个只能访问 tenant_id = 'acme-corp' 文档的Key
// POST /keys
{
  "description": "Key for tenant acme-corp",
  "actions": ["search"],
  "indexes": ["documents"],
  "expiresAt": null, // 永不过期
  "filter": "tenant_id = 'acme-corp'"
}

后端服务在用户通过SAML登录后，需要从数据库或缓存中查找与该租户关联的Meilisearch Key，并将其下发给前端或在后续的代理请求中使用。

此方案的优劣分析：

优点: 隔离性由Meilisearch引擎保证，安全性和性能远超方案A。
缺点:
1. 密钥管理复杂: 需要安全地存储、轮换和撤销成千上万个API Key。这引入了一个新的、有状态的依赖——密钥存储。
2. 生命周期同步: 当租户被禁用或删除时，必须同步去Meilisearch撤销其API Key，这增加了系统操作的复杂性和出错的可能性。
3. 静态权限: 密钥的权限是静态的。如果需要更细粒度的、基于用户角色的搜索权限，此模型将变得异常笨拙。

虽然可行，但这种方案的管理开销和僵化的权限模型使其在快速迭代的SaaS环境中显得不够理想。

最终选择：基于JWT的动态范围化临时密钥（JWT-Scoped Ephemeral Keys）

我们最终采用的架构，旨在结合JWT的无状态特性和Meilisearch强大的密钥生成能力。它既能保证绝对的数据隔离，又避免了持久化密钥管理的开销。

整个流程的核心思想是：认证与授权分离，信任链传递。

sequenceDiagram
    participant User as 用户 (PWA)
    participant IdP as 企业身份提供商 (SAML IdP)
    participant AppBE as 应用后端 (SAML SP)
    participant Meili as Meilisearch

    User->>IdP: 1. 发起登录请求
    IdP-->>User: 2. 要求用户认证
    User->>IdP: 3. 提交凭证
    IdP->>AppBE: 4. 认证成功, 通过浏览器重定向发送SAML Assertion
    AppBE->>AppBE: 5. 验证SAML Assertion, 解析用户信息 (email, name, tenant_id)
    AppBE-->>User: 6. 签发内部JWT (含tenant_id), 重定向回PWA
    User->>User: 7. PWA存储JWT

    Note over User, AppBE: 用户已登录, PWA持有JWT

    User->>AppBE: 8. 请求临时搜索密钥 (携带JWT)
    AppBE->>AppBE: 9. 验证JWT, 提取 tenant_id
    AppBE->>Meili: 10. 使用Master Key为该 tenant_id 生成一个带filter和过期时间的临时Search Key
    Meili-->>AppBE: 11. 返回临时Key
    AppBE-->>User: 12. 返回临时Key给PWA

    User->>Meili: 13. 使用临时Key直接发起搜索请求 (filter在Key中强制生效)
    Meili->>Meili: 14. 引擎根据Key内嵌的filter规则执行查询
    Meili-->>User: 15. 返回仅属于该租户的搜索结果

这个架构将后端服务定位成一个“令牌转换”和“能力授予”中心，而不是数据代理。

核心实现：后端 (Node.js + Express)

首先，我们需要一个能够消费SAML Assertion并签发我们内部JWT的服务。

// /services/authService.js
import jwt from 'jsonwebtoken';
import { Passport } from 'passport';
import { Strategy as SamlStrategy } from 'passport-saml';
import { findOrCreateUserFromSaml } from './userService';

// 从环境变量或安全配置中加载
const JWT_SECRET = process.env.JWT_SECRET;
const SAML_ENTRY_POINT = process.env.SAML_IDP_ENTRY_POINT;
const SAML_ISSUER = process.env.SAML_SP_ISSUER;
const SAML_CERT = process.env.SAML_IDP_CERT;

const samlStrategy = new SamlStrategy(
  {
    path: '/auth/saml/callback',
    entryPoint: SAML_ENTRY_POINT,
    issuer: SAML_ISSUER,
    cert: SAML_CERT,
    // ... 其他SAML配置
  },
  async (profile, done) => {
    try {
      // profile中包含了从IdP断言中解析出的属性
      // 例如：profile.email, profile.tenantId, profile.nameID
      const { user, tenant } = await findOrCreateUserFromSaml(profile);
      
      if (!user || !tenant) {
        return done(new Error('User or Tenant not found or provisioned.'));
      }
      
      // 返回的用户信息将用于签发JWT
      return done(null, { 
        id: user.id,
        email: user.email,
        tenantId: tenant.id,
        roles: user.roles,
      });
    } catch (error) {
      return done(error);
    }
  }
);

export const passport = new Passport();
passport.use(samlStrategy);

// SAML回调处理路由
app.post('/auth/saml/callback',
  passport.authenticate('saml', { failureRedirect: '/login/fail', session: false }),
  (req, res) => {
    // 登录成功, req.user 包含了 samlStrategy 的 done 回调返回的数据
    const payload = {
      sub: req.user.id,
      tid: req.user.tenantId,
      roles: req.user.roles,
    };

    // 签发内部使用的JWT，有效期可以设置得长一些，例如8小时
    const token = jwt.sign(payload, JWT_SECRET, { expiresIn: '8h' });

    // 通常会重定向到前端，并将token作为参数或写入安全的cookie
    res.redirect(`https://app.yourdomain.com/auth/callback?token=${token}`);
  }
);

接下来是关键的临时搜索密钥生成端点。

// /routes/searchKeys.js
import { MeiliSearch } from 'meilisearch';
import express from 'express';
import { authenticateJwt } from '../middleware/auth'; // JWT验证中间件

const router = express.Router();

const meiliAdminClient = new MeiliSearch({
  host: process.env.MEILI_HOST,
  apiKey: process.env.MEILI_MASTER_KEY,
});

/**
 * @route POST /api/search-keys
 * @desc Generates a short-lived, tenant-scoped Meilisearch search key.
 * @access Private
 */
router.post('/', authenticateJwt, async (req, res) => {
  try {
    const { tid: tenantId, sub: userId } = req.user; // 从已验证的JWT中获取租户ID和用户ID

    if (!tenantId) {
      // 日志记录：JWT中缺少tenantId
      console.error(`Missing tenantId in JWT for user ${userId}`);
      return res.status(400).json({ msg: 'Invalid authentication token: missing tenant identifier.' });
    }

    // 密钥配置
    const keyOptions = {
      description: `Temp key for tenant '${tenantId}', user '${userId}'`,
      // 关键！强制所有搜索都带上这个filter
      filter: `tenant_id = '${tenantId}'`, 
      actions: ['search'], // 权限最小化，只允许搜索
      indexes: ['documents', 'products'], // 只能搜索指定的索引
      // 设置一个较短的过期时间，例如5分钟。前端可以根据需要缓存和刷新。
      expiresAt: new Date(Date.now() + 5 * 60 * 1000).toISOString(),
    };

    const newKey = await meiliAdminClient.createKey(keyOptions);

    res.json({
      apiKey: newKey.key,
      expiresAt: newKey.expiresAt,
    });

  } catch (error) {
    // 生产环境中应使用专业的日志库
    console.error('Failed to generate Meilisearch key:', error);
    if (error.code === 'meilisearch_api_error') {
        return res.status(502).json({ msg: 'Search service communication error.' });
    }
    return res.status(500).json({ msg: 'Internal server error.' });
  }
});

export default router;

这段代码的核心是利用Meilisearch createKey API的filter和expiresAt参数，动态地为每个请求生成一个能力受限的临时凭证。

核心实现：前端 (React PWA + React Testing Library)

前端PWA需要管理认证状态、在需要时获取临时搜索密钥，并用它来初始化Meilisearch客户端。

// /hooks/useScopedMeiliSearch.js
import { useState, useEffect, useCallback } from 'react';
import { MeiliSearch } from 'meilisearch';

// 假设我们有一个API客户端来处理认证头等
import { apiClient } from '../services/apiClient';

const KEY_CACHE_KEY = 'meili_scoped_key';

export function useScopedMeiliSearch() {
  const [client, setClient] = useState(null);
  const [error, setError] = useState(null);
  const [isLoading, setIsLoading] = useState(true);

  const getNewKey = useCallback(async () => {
    try {
      const { data } = await apiClient.post('/search-keys');
      const keyData = {
        apiKey: data.apiKey,
        // 在过期前60秒刷新，增加鲁棒性
        expiresAt: new Date(data.expiresAt).getTime() - 60000, 
      };
      localStorage.setItem(KEY_CACHE_KEY, JSON.stringify(keyData));
      return keyData;
    } catch (err) {
      // 妥善处理错误，可能意味着需要用户重新登录
      setError('Failed to refresh search credentials.');
      console.error(err);
      return null;
    }
  }, []);

  useEffect(() => {
    const initializeClient = async () => {
      setIsLoading(true);
      setError(null);
      let keyData = null;
      
      try {
        const cachedKey = localStorage.getItem(KEY_CACHE_KEY);
        if (cachedKey) {
          keyData = JSON.parse(cachedKey);
        }
      } catch (e) {
        // LocalStorage可能不可用或数据损坏
        console.warn("Could not parse cached search key.", e);
        localStorage.removeItem(KEY_CACHE_KEY);
      }

      // 如果没有缓存的key，或者key已过期，则获取新的
      if (!keyData || keyData.expiresAt <= Date.now()) {
        keyData = await getNewKey();
      }

      if (keyData?.apiKey) {
        const meiliClient = new MeiliSearch({
          host: process.env.REACT_APP_MEILI_HOST, // 前端直连Meili, 需配置CORS
          apiKey: keyData.apiKey,
        });
        setClient(meiliClient);
      }
      setIsLoading(false);
    };

    initializeClient();
  }, [getNewKey]);

  return { client, isLoading, error };
}

这个自定义Hook封装了获取、缓存和刷新临时密钥的逻辑，为UI组件提供了一个随时可用的、安全的Meilisearch客户端实例。

测试这个复杂流程 (React Testing Library + MSW)

测试这种依赖外部服务和复杂认证流的组件是至关重要的。我们使用Mock Service Worker (MSW)来拦截网络请求，模拟后端行为。

// /components/SearchComponent.test.js
import { render, screen, waitFor } from '@testing-library/react';
import { rest } from 'msw';
import { setupServer } from 'msw/node';
import { SearchComponent } from './SearchComponent'; // 假设的搜索组件
import { SWRConfig } from 'swr'; // 用于清除缓存

// 1. 设置 MSW 服务器
const server = setupServer(
  // 模拟 /api/search-keys 端点
  rest.post('/api/search-keys', (req, res, ctx) => {
    return res(
      ctx.status(200),
      ctx.json({
        apiKey: 'a-valid-scoped-temporary-key',
        expiresAt: new Date(Date.now() + 10 * 60 * 1000).toISOString(),
      })
    );
  }),
  // 模拟对Meilisearch的请求
  // 注意：主机名必须与代码中使用的完全匹配
  rest.post('https://meili.yourdomain.com/indexes/documents/search', (req, res, ctx) => {
    // 我们可以验证请求头中是否包含了正确的apiKey
    const authHeader = req.headers.get('Authorization');
    if (authHeader !== 'Bearer a-valid-scoped-temporary-key') {
      return res(ctx.status(401), ctx.json({ message: 'Unauthorized' }));
    }
    
    return res(
      ctx.status(200),
      ctx.json({
        hits: [{ id: 'doc1', title: 'Test Document', tenant_id: 'acme-corp' }],
        query: 'test',
        processingTimeMs: 1,
      })
    );
  })
);

beforeAll(() => server.listen());
afterEach(() => {
  server.resetHandlers();
  // 清理 localStorage 和 SWR 缓存
  localStorage.clear();
  // 传入一个空的 cache provider 来重置
  render(<SWRConfig value={{ provider: () => new Map() }}></SWRConfig>);
});
afterAll(() => server.close());

// 测试用例
test('fetches scoped key, performs search, and displays results', async () => {
  render(<SearchComponent />);
  
  // 初始状态应为 loading
  expect(screen.getByText(/loading search.../i)).toBeInTheDocument();

  // 等待组件完成密钥获取和搜索
  // 使用 findBy*，它会等待元素出现
  const searchResult = await screen.findByText(/Test Document/i);
  
  // 验证结果是否已渲染
  expect(searchResult).toBeInTheDocument();
  
  // 验证 loading 状态已消失
  expect(screen.queryByText(/loading search.../i)).not.toBeInTheDocument();
});

test('handles error when failing to fetch a search key', async () => {
    // 覆盖默认的handler，模拟一个错误场景
    server.use(
        rest.post('/api/search-keys', (req, res, ctx) => {
            return res(ctx.status(500), ctx.json({ msg: 'Internal server error.' }));
        })
    );

    render(<SearchComponent />);
    
    // 等待错误信息显示
    const errorMessage = await screen.findByText(/failed to initialize search./i);
    expect(errorMessage).toBeInTheDocument();
});

这个测试验证了从密钥获取到最终数据显示的整个前端流程，确保了即使在复杂的异步和认证依赖下，UI也能按预期工作。

架构的局限性与展望

此架构虽然在安全性和可扩展性上表现出色，但也并非没有权衡：

网络开销: 每次密钥过期后，都需要一次额外的网络往返来获取新密钥。通过调整密钥有效期（例如5-15分钟）和在前端实现智能的预取（pre-fetching）策略，可以在用户体验和安全性之间找到平衡。
时钟同步: 临时密钥的有效性依赖于应用后端与Meilisearch服务器之间的时钟同步。在分布式环境中，必须确保NTP服务正常工作，以避免因时钟偏差导致密钥提前或延迟失效。
前端直连的复杂性: PWA直接连接Meilisearch需要妥善处理CORS策略，并且将Meilisearch实例暴露在公网上（即使有防火墙规则限制）。对于某些超高安全要求的场景，可能仍需通过后端代理所有搜索请求，但这又会退化为一种有状态的瓶颈。

未来的优化方向可能包括：使用边缘计算（Edge Functions）来生成临时密钥，从而降低延迟；或者探索下一代搜索引擎是否原生支持基于JWT claims的访问控制，从而彻底消除对临时密钥的需求。

JWT PWA Meilisearch SAML React Testing Library

使用 Zig 构建集成 Consul 与 LevelDB 的高韧性 InfluxDB 指标代理

2023-10-27 后端架构

Consul LevelDB InfluxDB Zig

在 Nuxt.js 中集成基于 Event Sourcing 的 CQRS 读模型实现高性能搜索

2023-10-27 后端架构

Meilisearch Nuxt.js Event Sourcing Search CQRS