之前分享過一期有關(guān)企業(yè)AI知識(shí)庫(kù)搭建的寶塔面板教程,看出大家對(duì)這類內(nèi)容很感興趣。那么本文將主要介紹基于亞馬遜云科技的云產(chǎn)品Amazon Bedrock+DeepSeek搭建企業(yè)知識(shí)庫(kù)的操作步驟,無(wú)需任何編程經(jīng)驗(yàn)都能學(xué)會(huì),教你快速搭建屬于自己的基于RAG架構(gòu)企業(yè)內(nèi)部文檔可交互問答系統(tǒng)。
相關(guān)推薦:《寶塔面板搭建企業(yè)AI知識(shí)庫(kù)》
一、注冊(cè)亞馬遜云科技海外區(qū)域賬號(hào)
亞馬遜云科技官網(wǎng):點(diǎn)擊訪問(注冊(cè)立享100+免費(fèi)云產(chǎn)品)
1、訪問亞馬遜云科技官網(wǎng)點(diǎn)擊右上方“立即注冊(cè)”。
2、注冊(cè)亞馬遜云科技賬號(hào)。
二、準(zhǔn)備與導(dǎo)入企業(yè)知識(shí)數(shù)據(jù)
1、在亞馬遜云科技控制臺(tái)頂部搜索欄中輸入“S3”,點(diǎn)擊進(jìn)入AWS S3控制臺(tái)。
2、點(diǎn)擊“Create bucket”(創(chuàng)建存儲(chǔ)桶)并輸入存儲(chǔ)桶名稱。
3、填寫存儲(chǔ)桶名字,其他設(shè)置保持默認(rèn),然后再次點(diǎn)擊“Create bucket”(創(chuàng)建存儲(chǔ)桶)。
4、創(chuàng)建完成后,點(diǎn)擊進(jìn)入該bucket。
5、點(diǎn)擊“Upload”(上傳)。
6、上傳知識(shí)文檔,例如PDF、DOCX、TXT、HTML等格式的文件。
例如將一份txt格式的“2025年公司考勤管理制度”上傳到Amazon S3存儲(chǔ)桶(其中做了一些自定義設(shè)置,以便于驗(yàn)證知識(shí)庫(kù)調(diào)用)。
三、開通Amazon Bedrock和DeepSeek模型權(quán)限
1、在亞馬遜云科技控制臺(tái)的搜索框中輸入“Bedrock”,然后點(diǎn)擊Amazon Bedrock。
2、進(jìn)入Amazon Bedrock頁(yè)面后,找到頁(yè)面中的“Model access”(模型訪問)設(shè)置板塊,仔細(xì)檢查自身賬號(hào)是否已具備DeepSeek的使用權(quán)限。
3、如果沒有DeepSeek模型的使用權(quán)限,請(qǐng)點(diǎn)擊頁(yè)面上的“申請(qǐng)”按鈕。
4、在模型選擇頁(yè)面中,勾選本次教程所需的DeepSeek模型。
5、完成模型勾選后,點(diǎn)擊“提交”按鈕完成模型申請(qǐng)操作。
提交申請(qǐng)后,一般系統(tǒng)會(huì)在短時(shí)間內(nèi)審核并授予權(quán)限,待權(quán)限獲取成功后就可以開始使用DeepSeek模型。
四、創(chuàng)建企業(yè)知識(shí)庫(kù)
1、現(xiàn)在返回亞馬遜云科技Amazon Bedrock控制臺(tái),點(diǎn)擊左側(cè)“Knowledge Base”(知識(shí)庫(kù)),進(jìn)入知識(shí)庫(kù)管理頁(yè)面。
2、點(diǎn)擊“Create”(創(chuàng)建),根據(jù)準(zhǔn)備的數(shù)據(jù)類型,選擇開始創(chuàng)建流程。
3、自定義知識(shí)庫(kù)名稱:如company-kb。
4、設(shè)置知識(shí)庫(kù)數(shù)據(jù)來(lái)源:選擇亞馬遜云服務(wù)Amazon S3,因?yàn)橐B接到剛才上傳的Amazon S3存儲(chǔ)桶。
5、設(shè)置完成,點(diǎn)擊“next”(下一步)。
6、選擇Amazon S3數(shù)據(jù)源。
7、選擇上傳文檔的Amazon S3 Bucket。
8、繼續(xù)點(diǎn)擊“next”(下一步)。
9、設(shè)置嵌入模型。
10、建議選擇Amazon Titan Embeddings(Amazon Bedrock原生)。
11、設(shè)置向量存儲(chǔ):此處可以保留默認(rèn)(Amazon OpenSearch Serverless)。
12、點(diǎn)擊“next”(下一步)后,確認(rèn)設(shè)置,點(diǎn)擊“Create knowledge base”(創(chuàng)建知識(shí)庫(kù))。
等待幾分鐘后,知識(shí)庫(kù)文檔會(huì)自動(dòng)進(jìn)行解析、嵌入并構(gòu)建索引。
五、調(diào)用生產(chǎn)模型
1、接下來(lái)需要同步知識(shí)庫(kù),在Amazon Bedrock的操作界面中,進(jìn)入Knowledge Bases,勾選新建的“knowledge base”,點(diǎn)擊“Sync”(同步)。
2、選擇測(cè)試知識(shí)庫(kù)的生產(chǎn)模型(目前在控制臺(tái)內(nèi)只能測(cè)試部分大模型)。
3、在AWS右側(cè)對(duì)話框中,可以使用選擇的大模型對(duì)剛剛上傳的公司考勤制度進(jìn)行測(cè)試??梢钥吹酱竽P透鶕?jù)知識(shí)庫(kù)中的信息對(duì)問題進(jìn)行了回答。
六、使用Python基于知識(shí)庫(kù)調(diào)用DeepSeek大模型
1、可以使用Anaconda一鍵裝好Python和虛擬環(huán)境,安裝完成后,打開“Anaconda Prompt”。
2、在Anaconda Prompt中輸入以下代碼,創(chuàng)建項(xiàng)目文件夾:
mkdir aws_rag_project
cd aws_rag_project
3、為Python安裝必要庫(kù):
pip install boto3 langchain langchain-community pandas python-dotenv
4、繼續(xù)在Anaconda Prompt中配置亞馬遜云科技登錄授權(quán):
aws configure
5、這里需要輸入Amazon Access Key ID、Amazon Secret Access Key和默認(rèn)Region。
這些信息可以在Amazon IAM中獲取或者新建access key,具體Amazon IAM使用方法可參考相關(guān)教程,站長(zhǎng)百科后期也會(huì)為大家分享。
6、在Anaconda Prompt中創(chuàng)建項(xiàng)目環(huán)境設(shè)置.env文件:
echo AWS_REGION=us-east-1 > .env
echo AWS_PROFILE=default >> .env
成功后,會(huì)在項(xiàng)目文件夾中看到.env文件。
7、將以下調(diào)用DeepSeek的python文件保存在項(xiàng)目文件夾中。
Python文件代碼如下:
import os
import boto3
from dotenv import load_dotenv
from botocore.exceptions import NoCredentialsError, ProfileNotFound# 第一步:加載 .env 文件
load_dotenv()# 第二步:讀取環(huán)境變量
region = os.getenv(“AWS_REGION”)
profile = os.getenv(“AWS_PROFILE”)print(“?? 檢查當(dāng)前 AWS 配置…”)
print(“?? AWS Region:”, region)
print(“?? AWS Profile:”, profile)# 第三步:驗(yàn)證 AWS 配置是否存在
ifnot region ornot profile:
print(“? 錯(cuò)誤:環(huán)境變量 AWS_REGION 或 AWS_PROFILE 未設(shè)置。請(qǐng)檢查 .env 文件。”)
exit(1)# 第四步:嘗試連接 AWS Bedrock
try:
session = boto3.Session(profile_name=profile, region_name=region)
bedrock_agent_runtime = session.client(service_name=’bedrock-agent-runtime’)
except ProfileNotFound:
print(f”? 錯(cuò)誤:找不到名為 ‘{profile}’ 的 AWS profile。請(qǐng)先運(yùn)行 aws configure 設(shè)置。”)
exit(1)
except NoCredentialsError:
print(“? 錯(cuò)誤:未檢測(cè)到有效的 AWS 憑證。請(qǐng)確保已使用 aws configure 設(shè)置 Access Key。”)
exit(1)print(“? AWS 環(huán)境配置成功,開始調(diào)用知識(shí)庫(kù)…”)
# 第五步:設(shè)置知識(shí)庫(kù) ID 和模型 ARN(請(qǐng)?zhí)鎿Q為你自己的)
knowledge_base_id = “你的知識(shí)庫(kù)ID” # ← 在控制臺(tái)查看 Knowledge Base ID
model_arn = “你的 model ARN” # 可替換為 DeepSeek 等# 第六步:輸入你的問題
user_input = “公司全勤獎(jiǎng)是多少錢?”# 第七步:調(diào)用知識(shí)庫(kù)進(jìn)行 RAG 問答
try:
response = bedrock_agent_runtime.retrieve_and_generate(
input={“text”: user_input},
retrieveAndGenerateConfiguration={
“type”: “KNOWLEDGE_BASE”,
“knowledgeBaseConfiguration”: {
“knowledgeBaseId”: knowledge_base_id,
“modelArn”: model_arn
}
}
)# 第八步:打印模型回答
print(“\n?? 模型回答:”)
print(response[“output”][“text”])except Exception as e:
print(“? 出現(xiàn)錯(cuò)誤:”, str(e))
注意:在第五步需要設(shè)置好知識(shí)庫(kù)ID和你想要調(diào)用模型的ARN。
知識(shí)庫(kù)ID可以在Amazon Bedrock的“knowledge base”中找到。
Model ARN建議在Amazon Bedrock的Cross-region inference中找到,這里搜索DeepSeek可以獲取相應(yīng)ARN。
現(xiàn)在可以在Anaconda Prompt中運(yùn)行Python文件,調(diào)用DeepSeek大模型,并結(jié)合企業(yè)知識(shí)庫(kù)進(jìn)行問答。例如當(dāng)提出有關(guān)員工遲到和全勤獎(jiǎng)勵(lì)的規(guī)定時(shí),DeepSeek會(huì)基于上傳的考勤制度文件,給出準(zhǔn)確回答。
七、退出/清理環(huán)境
由于Amazon Bedrock控制臺(tái)中的Playground屬于即開即用型服務(wù),因此使用完畢后無(wú)需額外退出操作即可結(jié)束會(huì)話,不用擔(dān)心資源占用問題。但知識(shí)庫(kù)底層依賴的Amazon OpenSearch Serverless(用于向量化數(shù)據(jù)的存儲(chǔ)與檢索)會(huì)單獨(dú)計(jì)費(fèi),所以如果確定短期內(nèi)不再使用該知識(shí)庫(kù),建議按照以下順序清理資源,以避免產(chǎn)生不必要的費(fèi)用。
1、在Amazon Bedrock里面刪除“knowledge base”。
2、在Amazon OpenSearch里面刪除“collections”。
3、在Amazon S3服務(wù)中刪除上傳的Amazon S3文件。
通過以上七個(gè)步驟,即可在控制臺(tái)中無(wú)需編寫代碼成功構(gòu)建企業(yè)級(jí)知識(shí)庫(kù)問答系統(tǒng)。另外,對(duì)于控制臺(tái)不支持的大模型,可以使用提供的Python腳本實(shí)現(xiàn)調(diào)用。也可以考慮使用亞馬遜云服務(wù)器 (如Amazon EC2或Amazon Lightsail) 搭建該系統(tǒng),其中Amazon提供12個(gè)月免費(fèi)套餐,足夠一般小型業(yè)務(wù)負(fù)載。
相關(guān)推薦:
《AI圖像生成工具怎么用 豆包+即夢(mèng)一鍵出圖指南》
《Amazon SageMaker+LLaVA實(shí)現(xiàn)圖片自動(dòng)化分類》
《5分鐘快速部署DeepSeek個(gè)人站點(diǎn)》
《亞馬遜云科技Amazon EC2部署DeepSeek-R1蒸餾模型教程》
《DeepSeek搭建個(gè)人知識(shí)庫(kù)》
-
廣告合作
-
QQ群號(hào):4114653