澳门沙金网址(中国)官方网站IOS/安卓通用版

澳门沙金网址APP

宣布时候：2020-08-03 文章来历：//aqygyl.com/

当人们提到大型说话模子（LLM）时，降生凡是会想到像OpenAI的自暗资安ChatGPT如许的产物，这类产物在各行业中普遍操纵，尽份如搜刮引擎、降生语音助手和客户办事。自暗资安稳而，尽份一个题目一向搅扰着LLM的降生操纵：它们须要停止大批的预练习和微调任务，这可以或许会破费大批的自暗资安时候和资本。

比来，尽份韩国研讨职员经由过程从暗网中搜集数据缔造了一个新的降生LLM，名为“DarkBERT”。自暗资安 DarkBERT基于BERT和RoBERTa，尽份并操纵Tor搜集爬取了暗网数据停止练习。降生因为该数据包罗黑客、自暗资安欺骗党和罪犯的尽份材料，是以该团队操纵了预处置手艺和阐发权重等方式来解除受益者信息并过滤出原始材料来建立一组暗网数据库。另外，从论文中的表格可以或许看到，该数据库首要触及成人图象、药物和金流等种别。

固然DarkBERT的练习数据来历有争议，但该模子具备良多现实操纵代价，比方检测讹诈软件、侦测泄漏机灵数据站点，或是及时监控不法信息等资案用处。固然研讨团队今朝不发布详细的打算，但可以或许请求操纵DarkBERT以学术为目标。

点评：

即便从最不平常的来历搜集数据，也可以或许练习有效的野生智能模子。固然一些人可以或许担忧暗网数据对DarkBERT的影响，但这并不禁止研讨职员将其用于现实操纵中。这标明，在AI手艺敏捷成长的明天，咱们须要加倍存眷若何让这些手艺在受控和通明的情况下运转，确保它们可以或许发生主动的社会效益。

前往列表

消息中间