发布说明
本文档详细介绍了Pinecone的发布信息。有关使用特定功能的信息,请参见我们的API参考。
2023年4月26日
入门版计划中的索引现在支持大约100,000个1536维嵌入和元数据。其他维度的容量成比例。
2023年4月3日
Pinecone现在支持新的美国和欧洲云区域。
2023年3月21日
Pinecone现在支持企业级SSO。请联系我们[email protected]来设置你的集成。
2023年3月1日
Pinecone现在支持每个向量40kb的元数据。了解更多。
2023年2月22日
稀疏-密集嵌入现已公开预览。
Pinecone现在支持带有稀疏和密集值的向量。要在Python中使用稀疏-密集嵌入,请升级到Python客户端版本2.2.0。
Pinecone Python客户端版本2.2.0现已推出
支持稀疏-稠密嵌入的Python客户端版本2.2.0现已在GitHub和PYPI上发布。
2023年2月15日
新的Node.js客户端现已公开预览
现在您可以尝试我们的新的Pinecone Node.js客户端。
2023年2月14日
在 Pinecone 控制台中新增了使用报告
您现在可以通过使用情况仪表板,监控您当前和预计的 Pinecone 使用情况。
2023年1月31日
Pinecone现在可在AWS Marketplace上使用
您现在可以通过Amazon Web Services Marketplace注册Pinecone计费。
2023年1月3日
Pinecone Python客户端版本2.1.0现在在GitHub上可用。
Python客户端的最新版本进行了以下更改:
修复了长时间空闲后出现的“Connection Reset by peer”错误
为所有客户端操作添加了类型和显式参数名称
为所有客户端操作添加了文档字符串
Adds Support for batch upserts by passing
batch_size
to the upsert method提高了gRPC查询结果解析性能
2022年12月22日
Pinecone现在在GCP Marketplace中可用
您现在可以通过Google Cloud Platform Marketplace注册Pinecone账单。
2022年12月6日
组织通常是可用的
Pinecone现在拥有组织功能,允许一个或多个用户在同一组织下控制账单和项目设置。
p2 pod类型通常是可用的
p2 pod类型现在已经普遍可用,并准备好承载生产工作负载。p2 pod现在在Starter计划中提供,并支持dotproduct
距离度量。
性能改进
2022年10月31日
混合搜索(早期访问)
Pinecone现在支持使用新的混合搜索索引和终端实现基于关键词的语义搜索。混合搜索通过将语义搜索结果与关键词搜索相结合,提高了语义搜索结果的相关性。
这是一个早期访问的功能,只能通过注册来使用。
2022年10月17日
状态页面
新的Pinecone状态页显示Pinecone服务的状态信息,包括各个云区域的状态和最近事件的日志。
2022年9月16日
公共集合
现在,您可以从包含真实数据源的公共数据集中创建索引,这些数据集被称为公共集合。目前,公共集合包括Glue - SSTB集合、TREC问题分类集合和SQuAD集合。
2022年8月16日
集合(公共预览)("Beta")
现在您可以使用集合(collections)制作您索引的静态副本。创建集合后,您可以从该集合创建一个新的索引,新索引可以使用任何Pod类型和任意数量的Pod。创建集合只会占用存储空间。
这是一个公共预览功能,不适用于生产工作负载。
垂直扩展
在不中断读写的情况下,可以动态地增加或减少p1、s1和p2 pod的数量。现在,p1和s1 pod类型在四种不同的大小中可用: 1x
、2x
、4x
和 8x
。每个单元的容量和计算能力随着大小的增加而加倍。
p2 Pod类型(公共预览)("Beta")
新的p2 Pod类型提供的搜索速度约为5毫秒,每个副本的查询吞吐量为每秒200个查询,或者根据您的数据和网络条件,大约比p1 Pod类型快10倍的速度和更高的吞吐量。
这是一个公共预览版功能,不适用于生产工作负载。
提高了p1和s1的性能
s1和p1 Pod类型现在提供约50%更高的查询吞吐量和50%更低的延迟,具体取决于您的工作负载。
2022年7月26日
现在,您可以通过使用filter
对象在调用带有describe_index_stats
的元数据过滤器来获取索引中向量子集的结果。
describe_index_stats
操作现在使用POST
HTTP请求类型。filter
参数仅被使用POST
请求类型的describe_index_stats
调用所接受。使用GET
请求类型的describe_index_stats
调用现在已被弃用。
2022年7月12日
Pinecone控制台引导介绍
您现在可以选择在Pinecone控制台中跟随引导式教程。这个交互式教程会带您完成创建您的第一个索引、更新向量和查询数据的所有步骤。这个教程的目的是向您展示在Pinecone中开始第一个项目的所有步骤。
2022年6月24日
更新响应码
create_index
,delete_index
和scale_index
操作现在使用更具体的HTTP响应代码来描述成功的操作类型。
2022年6月7日
选择性元数据索引
现在您可以存储更多的元数据和更多的唯一元数据值!选择您想要索引过滤的元数据字段以及您只希望存储和检索哪些字段。当您索引元数据字段时,可以使用这些字段过滤向量搜索查询。当您存储元数据字段而不对其进行索引时,可以保持内存利用率低,特别是当您有许多唯一的元数据值时,因此可以在每个pod中装入更多向量。
单向量查询
现在,您可以使用vector
输入指定单个查询向量。我们现在鼓励所有用户使用单个向量而不是一批向量进行查询,因为批量查询可能导致响应消息和查询时间过长,而单个查询在服务器端的执行速度也同样快。详情请见:使用单个向量查询。
按ID查询
现在,您可以仅使用另一个向量的ID来查询您的Pinecone索引。当您想要搜索已经存储在Pinecone中的向量的最近邻时,这非常有用。
提高索引充实度和准确性
describe_index_stats()
结果中的索引充实度度量现在更加精确。
2022年4月25日
部分更新(公共预览版)
现在您可以按ID和单个值对执行部分更新。这样您就可以更新单个元数据字段,而无需插入匹配向量或一次性更新所有元数据字段。
新指标
所有计划的用户现在可以在Pinecone控制台中查看过去一(1)周的指标。企业和企业专用计划的用户现在可以通过Prometheus指标端点访问以下指标:
pinecone_vector_count
pinecone_request_count_total
pinecone_request_error_count_total
pinecone_request_latency_seconds
pinecone_index_fullness
(Public Preview)
注意:pinecone_index_fullness
度量的准确性已得到提高。 这可能导致历史报告值的变化。该度量正在公开预览中。
Spark连接器
希望管理并行upserts到Pinecone的Spark用户现在可以使用Pinecone官方Spark连接器从Spark数据框中upsert数据。
支持布尔型和浮点型元数据在Pinecone索引中
现在可以在与Pinecone索引相关联的元数据JSON对象中添加Boolean
和float64
值。
在describe_index结果中新增state字段
describe_index
操作结果现在包含一个state
值,用于描述索引状态。state
的可能值为Initializing
、ScalingUp
、ScalingDown
、Terminating
和Ready
。