本文分类:news发布日期:2025/3/10 19:16:45
相关文章
大语言模型中Top-K和Top-P是两种核心的文本生成策略
目录
一、Top-K 采样的原理
二、Top-P(核采样)的原理
三、Top-K 与 Top-P 的差异对比
四、联合使用策略
五、扩展:与Temperature的关系 在大语言模型中,Top-K和Top-P是两种核心的文本生成策略,用于平衡生成内容的…
建站知识
2025/3/7 5:28:29
软考架构师笔记-计算机网络
1.9 计算机网络
OSI/RM 七层模型
物理层 二进制传输(中继器、集线器) (typedef) 数据链路层 传送以帧为单位的信息(网桥、交换机、网卡) 网络层 分组传输和路由选择(三层交换机、路由器)ARP/RARP/IGMP/ICMP/IP 传输层 端到端的连接(TCP/UDP)在前向纠错系统中,当接…
建站知识
2025/3/7 5:26:27
2025-03-06 ffmpeg提取SPS/PPS/SEI ( extradata )
一、需求
在某些情况下,可能需要直接使用H264/H265等原始数据流进行解码,比较常用的udp下的h264/h265。这时需要 av_parser_parse2 来组AVPacket,但对于视频的信息:宽高、格式等,可以根据 AVCodecParserContext 来获取࿰…
建站知识
2025/3/7 5:24:24
【漫话机器学习系列】121.偏导数(Partial Derivative)
偏导数(Partial Derivative)详解
1. 引言
在数学分析、机器学习、物理学和工程学中,我们经常会遇到多个变量的函数。这些函数的输出不仅取决于一个变量,而是由多个变量共同决定的。那么,当其中某一个变量发生变化时&…
建站知识
2025/3/7 5:22:19
视频录像机视频通道是指什么
视频录像机的视频通道是指摄像机在监控矩阵或硬盘录像机设备上的视频输入的物理位置。
与摄像头数量关系:在视频监控系统中,有多少个摄像头就需要多少路视频通道,通道数量决定了视频录像机可接入摄像头的数量,一般硬盘录像机有4路…
建站知识
2025/3/7 5:20:17
笔记:在Git中.gitmodules文件的功能和作用和如何使用
一、目的:简单介绍下在Git中.gitmodules文件的功能和作用已经 .gitmodules 文件是 Git 子模块(submodule)功能的一部分,用于管理和配置子模块。子模块允许一个 Git 仓库包含另一个 Git 仓库作为其子目录,这对于管理依赖…
建站知识
2025/3/7 5:19:16
LLM论文笔记 18: When Do Program-of-Thought Works for Reasoning?
Arxiv日期:2023.12.18机构:ZJU / Donghai Laboratory / NUS 关键词
PoT(SFT)程序化复杂度自动分级过滤 核心结论
1. 编程语言具有明显的优势: 与序列化自然语言相比,它们对复杂结构的建模更胜一筹 固有的…
建站知识
2025/3/7 5:15:08
启智平台华为昇腾910B使用MS-Swift微调Janus-Pro-7/1B
最近想要微调一下DeepSeek出品的Janus多模态大模型
利用启智平台的昇腾910B国产计算卡进行大模型的微调
查看了一下MS-Swift支持了Janus模型的微调,LLamafactory好像暂时还不支持该模型的微调
看到了MS-Swift有单独对昇腾的支持,因此首先要安装swift&…
建站知识
2025/3/7 5:14:07