Skip to main content
Version: 3.17

ai-aliyun-content-moderation

描述#

ai-aliyun-content-moderation 插件集成了阿里云机器辅助审核 Plus,用于在代理 LLM 请求时检查请求和响应内容的风险等级,例如亵渎、仇恨言论、侮辱、骚扰、暴力等,当评估结果超过配置的阈值时拒绝请求。

请确保在插件中正确配置 access_key_secret。如果配置错误,审核检查将失败,请求可能仍会被转发到 LLM 上游。你将在网关的错误日志中看到来自插件的 Specified signature is not matched with our calculation 错误。

ai-aliyun-content-moderation 插件应与 ai-proxyai-proxy-multi 插件配合使用以代理 LLM 请求。

属性#

名称类型必选项默认值有效值描述
access_key_idstring阿里云访问密钥 ID。
access_key_secretstring阿里云访问密钥。该值在存储到 etcd 之前会使用 AES 加密。
region_idstring阿里云区域 ID。
endpointstring阿里云端点。
check_requestbooleantrue如果为 true,则审核请求内容。
check_responsebooleanfalse如果为 true,则审核响应内容。
stream_check_modestring"final_packet"realtimefinal_packet流式审核模式。realtime:流式传输期间批量检查。final_packet:在最后附加风险等级。
stream_check_cache_sizeinteger128>= 1realtime 模式下每次审核批次的最大字节数(按 UTF-8 编码后的字节长度计算)。
stream_check_intervalnumber3>= 0.1realtime 模式下批次检查之间的间隔秒数。
request_check_servicestring"llm_query_moderation"用于请求审核的阿里云服务。
request_check_length_limitnumber2000请求内容字节数上限(按 UTF-8 编码后的字节长度计算)。如果超过该限制,内容将被分块发送。对于非 ASCII 内容,可能会比按字符数理解时更早触发分块。例如,如果请求内容按 UTF-8 编码后有 250 个字节,且 request_check_length_limit 设置为 100,则内容将分 3 次请求发送到阿里云。
response_check_servicestring"llm_response_moderation"用于响应审核的阿里云服务。
response_check_length_limitnumber5000响应内容字节数上限(按 UTF-8 编码后的字节长度计算)。如果超过该限制,内容将被分块发送。对于非 ASCII 内容,可能会比按字符数理解时更早触发分块。例如,如果响应内容按 UTF-8 编码后有 250 个字节,且 response_check_length_limit 设置为 100,则内容将分 3 次请求发送到阿里云。
risk_level_barstring"high"nonelowmediumhighmax如果评估的风险等级低于 risk_level_bar,请求或响应将分别被放行到上游 LLM 或客户端。
deny_codenumber200拒绝时的 HTTP 状态码。
deny_messagestring拒绝时的消息。
timeoutinteger10000>= 1超时时间(毫秒)。
keepalivebooleantrue如果为 true,启用到阿里云的 HTTP 连接保活。
keepalive_poolinteger30>= 1连接保活池的最大连接数。
keepalive_timeoutinteger60000>= 1000连接保活超时时间(毫秒)。
ssl_verifybooleantrue如果为 true,启用 SSL 证书验证。

示例#

以下示例使用 OpenAI 作为上游服务提供商。在开始之前,请创建一个 OpenAI 账号 并获取 API 密钥。如果你使用其他 LLM 提供商,请参考相应提供商的文档获取 API 密钥。

此外,创建一个阿里云账号,开通机器辅助审核 Plus 服务,并获取端点、区域 ID、访问密钥 ID 和访问密钥。

note

你可以使用以下命令从 config.yaml 中获取 admin_key 并保存到环境变量中:

admin_key=$(yq '.deployment.admin.admin_key[0].key' conf/config.yaml | sed 's/"//g')

你可以选择将阿里云和 OpenAI 信息保存到环境变量:

# 替换为你的数据
export OPENAI_API_KEY=your-openai-api-key
export ALIYUN_ENDPOINT=https://green-cip.cn-shanghai.aliyuncs.com
export ALIYUN_REGION_ID=cn-shanghai
export ALIYUN_ACCESS_KEY_ID=your-aliyun-access-key-id
export ALIYUN_ACCESS_KEY_SECRET=your-aliyun-access-key-secret

审核请求内容毒性#

以下示例演示如何使用该插件审核请求中的内容毒性并自定义拒绝代码和消息。

创建一个路由到 LLM 聊天补全端点,使用 ai-proxy 插件,并在 ai-aliyun-content-moderation 插件中配置集成详情以及 deny_codedeny_message

curl "http://127.0.0.1:9180/apisix/admin/routes" -X PUT \
-H "X-API-KEY: ${admin_key}" \
-d '{
"id": "ai-aliyun-content-moderation-route",
"uri": "/anything",
"plugins": {
"ai-aliyun-content-moderation": {
"endpoint": "'"$ALIYUN_ENDPOINT"'",
"region_id": "'"$ALIYUN_REGION_ID"'",
"access_key_id": "'"$ALIYUN_ACCESS_KEY_ID"'",
"access_key_secret": "'"$ALIYUN_ACCESS_KEY_SECRET"'",
"deny_code": 400,
"deny_message": "Request contains forbidden content, such as hate speech or violence."
},
"ai-proxy": {
"provider": "openai",
"auth": {
"header": {
"Authorization": "Bearer '"$OPENAI_API_KEY"'"
}
}
}
}
}'

向该路由发送一个 POST 请求,请求体中包含系统提示和一个含有不当用语的用户问题:

curl -i "http://127.0.0.1:9080/anything" -X POST \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4",
"messages": [
{ "role": "system", "content": "You are a mathematician" },
{ "role": "user", "content": "Stupid, what is 1+1?" }
]
}'

你应该收到 HTTP/1.1 400 Bad Request 响应并看到以下消息:

{
"object": "chat.completion",
"usage": {
"completion_tokens": 0,
"prompt_tokens": 0,
"total_tokens": 0
},
"choices": [
{
"message": {
"role": "assistant",
"content": "Request contains forbidden content, such as hate speech or violence."
},
"finish_reason": "stop",
"index": 0
}
],
"model": "gpt-4",
"id": "c9466bbf-e010-469d-949a-a10f25525964"
}

向该路由发送另一个包含正常问题的请求:

curl -i "http://127.0.0.1:9080/anything" -X POST \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4",
"messages": [
{ "role": "system", "content": "You are a mathematician" },
{ "role": "user", "content": "What is 1+1?" }
]
}'

你应该收到 HTTP/1.1 200 OK 响应和模型输出:

{
"model": "gpt-4-0613",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "1+1 equals 2.",
"refusal": null
},
"logprobs": null,
"finish_reason": "stop"
}
]
}

调整风险等级阈值#

以下示例演示如何调整风险等级的阈值,该阈值用于控制请求或响应是否应被放行。

创建一个路由到 LLM 聊天补全端点,使用 ai-proxy 插件,并将 ai-aliyun-content-moderation 中的 risk_level_bar 配置为 high

curl "http://127.0.0.1:9180/apisix/admin/routes" -X PUT \
-H "X-API-KEY: ${admin_key}" \
-d '{
"id": "ai-aliyun-content-moderation-route",
"uri": "/anything",
"plugins": {
"ai-aliyun-content-moderation": {
"endpoint": "'"$ALIYUN_ENDPOINT"'",
"region_id": "'"$ALIYUN_REGION_ID"'",
"access_key_id": "'"$ALIYUN_ACCESS_KEY_ID"'",
"access_key_secret": "'"$ALIYUN_ACCESS_KEY_SECRET"'",
"deny_code": 400,
"deny_message": "Request contains forbidden content, such as hate speech or violence.",
"risk_level_bar": "high"
},
"ai-proxy": {
"provider": "openai",
"auth": {
"header": {
"Authorization": "Bearer '"$OPENAI_API_KEY"'"
}
},
"options": {
"model": "gpt-4"
}
}
}
}'

向该路由发送一个 POST 请求,请求体中包含系统提示和一个含有不当用语的用户问题:

curl -i "http://127.0.0.1:9080/anything" -X POST \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4",
"messages": [
{ "role": "system", "content": "You are a mathematician" },
{ "role": "user", "content": "Stupid, what is 1+1?" }
]
}'

你应该收到 HTTP/1.1 400 Bad Request 响应并看到以下消息:

{
"object": "chat.completion",
"usage": {
"completion_tokens": 0,
"prompt_tokens": 0,
"total_tokens": 0
},
"choices": [
{
"message": {
"role": "assistant",
"content": "Request contains forbidden content, such as hate speech or violence."
},
"finish_reason": "stop",
"index": 0
}
],
"model": "gpt-4",
"id": "c9466bbf-e010-469d-949a-a10f25525964"
}

将插件中的 risk_level_bar 更新为 max

curl "http://127.0.0.1:9180/apisix/admin/routes/ai-aliyun-content-moderation-route" -X PATCH \
-H "X-API-KEY: ${admin_key}" \
-d '{
"plugins": {
"ai-aliyun-content-moderation": {
"risk_level_bar": "max"
}
}
}'

发送相同的请求到该路由:

curl -i "http://127.0.0.1:9080/anything" -X POST \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4",
"messages": [
{ "role": "system", "content": "You are a mathematician" },
{ "role": "user", "content": "Stupid, what is 1+1?" }
]
}'

你应该收到 HTTP/1.1 200 OK 响应和模型输出:

{
"model": "gpt-4-0613",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "1+1 equals 2.",
"refusal": null
},
"logprobs": null,
"finish_reason": "stop"
}
]
}

这是因为"stupid"一词的风险等级为 high,低于配置的阈值 max