💙 Gate广场 #Gate品牌蓝创作挑战# 💙
用Gate品牌蓝,描绘你的无限可能!
📅 活动时间
2025年8月11日 — 8月20日
🎯 活动玩法
1. 在 Gate广场 发布原创内容(图片 / 视频 / 手绘 / 数字创作等),需包含 Gate品牌蓝 或 Gate Logo 元素。
2. 帖子标题或正文必须包含标签: #Gate品牌蓝创作挑战# 。
3. 内容中需附上一句对Gate的祝福或寄语(例如:“祝Gate交易所越办越好,蓝色永恒!”)。
4. 内容需为原创且符合社区规范,禁止抄袭或搬运。
🎁 奖励设置
一等奖(1名):Gate × Redbull 联名赛车拼装套装
二等奖(3名):Gate品牌卫衣
三等奖(5名):Gate品牌足球
备注:若无法邮寄,将统一替换为合约体验券:一等奖 $200、二等奖 $100、三等奖 $50。
🏆 评选规则
官方将综合以下维度评分:
创意表现(40%):主题契合度、创意独特性
内容质量(30%):画面精美度、叙述完整性
社区互动度(30%):点赞、评论及转发等数据
代币突破攻击通过单个字符绕过LLM安全保护
首页新闻* 研究人员已识别出一种名为TokenBreak的新方法,该方法通过改变文本输入中的单个字符,绕过大型语言模型(LLM)的安全性和管理。
研究团队在他们的报告中解释说,“TokenBreak攻击针对文本分类模型的代币化策略,以诱导假阴性,使最终目标容易受到保护模型旨在防止的攻击。” 代币化在语言模型中至关重要,因为它将文本转化为可以被算法映射和理解的单元。被操纵的文本可以通过LLM过滤器,触发与输入未被更改时相同的响应。
HiddenLayer发现TokenBreak适用于使用BPE (字节对编码)或WordPiece分词的模型,但不影响基于Unigram的系统。研究人员表示,*“了解底层保护模型的家族及其分词策略对于理解您对该攻击的敏感性至关重要。”*他们建议使用Unigram分词器,教导过滤模型识别分词技巧,并查看日志以寻找操控迹象。
这一发现是在HiddenLayer之前的研究基础上得出的,该研究详细说明了如何使用Model Context Protocol (MCP)工具,通过在工具的函数中插入特定参数来泄露敏感信息。
在一项相关的发展中,Straiker AI 研究团队表明,“年鉴攻击”——使用反义词对不良内容进行编码——可以欺骗来自 Anthropic、DeepSeek、Google、Meta、Microsoft、Mistral AI 和 OpenAI 等公司的聊天机器人产生不良响应。安全研究人员解释说,这些技巧会通过过滤器,因为它们类似于普通消息,并利用模型如何重视上下文和模式完成,而不是意图分析。
以前的文章: