多租户
本文档介绍了Pinecone索引中与多租户相关的概念。这包括有关在Pinecone索引中保持向量集合分开的不同方法的信息。要了解如何创建或修改索引,请参见管理索引。
您可能需要按客户或其他方式将向量分段,无论是物理上还是逻辑上。本文档描述了实现这一点的不同技术以及每种方法的优点和优势。
命名空间
一种多租户的方法是使用命名空间来隔离单个索引中向量的部分。这是一种“池”模型,它在租户之间共享大部分资源,同时保持逻辑上的分离。
优点
- 命名空间减少了需要额外索引的需求,减少了维护工作。
缺点
客户数据没有在自己的pod中隔离。这意味着租户共享计算和存储资源。
删除租户数据更加复杂,需要更多时间。
元数据过滤
这种多租户的方法将向量的所有部分都存储在单个索引中,并且在查询时通过元数据过滤。这是另一种“池”模型; 在这里,您在查询级别上分隔租户。
优点
元数据过滤允许您在多个租户之间查询。
元数据过滤减少了对额外索引的需求,减少了维护工作量。
缺点
客户数据没有被隔离在它自己的Pod中,这意味着多个租户共享计算和存储资源。
没有办法跟踪租户特定成本。
您不能根据租户属性配置不同的维度或Pod类型,这些属性是在索引级别设置的。
分离索引
多租户的另一种方法是为每个段创建独立的索引。这是一个“沙箱”模型,为每个租户提供专用资源。例如,如果您需要为每个客户分离向量,则可以为每个客户创建单独的索引。
优点
- 这个模型将租户分成不同的Pod,防止跨租户查询并将计算和存储资源分配给每个租户。
缺点
创建和维护多个索引需要额外的努力和成本。
因为此模型不在租户之间共享资源,所以您必须为每个租户分配至少一个pod。如果您的租户具有较少的矢量,则这是极其低效的。
创建新索引所需的时间比创建命名空间更长。 更新于 约2个月前