本文分类:news发布日期:2025/3/10 21:07:42
相关文章
笔记:在Git中.gitmodules文件的功能和作用和如何使用
一、目的:简单介绍下在Git中.gitmodules文件的功能和作用已经 .gitmodules 文件是 Git 子模块(submodule)功能的一部分,用于管理和配置子模块。子模块允许一个 Git 仓库包含另一个 Git 仓库作为其子目录,这对于管理依赖…
建站知识
2025/3/7 5:19:16
LLM论文笔记 18: When Do Program-of-Thought Works for Reasoning?
Arxiv日期:2023.12.18机构:ZJU / Donghai Laboratory / NUS 关键词
PoT(SFT)程序化复杂度自动分级过滤 核心结论
1. 编程语言具有明显的优势: 与序列化自然语言相比,它们对复杂结构的建模更胜一筹 固有的…
建站知识
2025/3/7 5:15:08
启智平台华为昇腾910B使用MS-Swift微调Janus-Pro-7/1B
最近想要微调一下DeepSeek出品的Janus多模态大模型
利用启智平台的昇腾910B国产计算卡进行大模型的微调
查看了一下MS-Swift支持了Janus模型的微调,LLamafactory好像暂时还不支持该模型的微调
看到了MS-Swift有单独对昇腾的支持,因此首先要安装swift&…
建站知识
2025/3/7 5:14:07
神经网络|(十三)|SOM神经网络
【1】引言
前序已经对神经网络有了基础认识,今天先学习SOM神经网络。
前序学习文章链接包括且不限于:
神经网络|(十一)|神经元和神经网络-CSDN博客
神经网络|(十二)|常见激活函数-CSDN博客
【2】SOM神经网络
SOM神经网络是一种结构比较简单、但是理…
建站知识
2025/3/7 5:13:06
STL:C++的超级工具箱(一)
书接上回,内存管理和指针:C的双刃手术刀(一)-CSDN博客,在上篇我们聊到了什么是内存,堆栈,内存管理和智能指针相关的内容,接下来让我们一起去看看STL是什么吧。 第一步:提…
建站知识
2025/3/7 5:12:05
推测gpt4o视觉皮层建立的过程
一、视觉输入的编码与结构化 视觉Tokenization的底层逻辑 图像分块与降维:输入图像被分割为固定大小的区块(例如16x16像素),每个区块通过线性变换(矩阵乘法)压缩为低维向量(如768维)…
建站知识
2025/3/7 5:11:03
【人工智能学习之优化为什么会失败】
【人工智能学习之优化为什么会失败与方案建议】 一、优化为什么会失败?失败原因:1. 局部极小值和鞍点2. 梯度消失/爆炸(Vanishing/Exploding Gradients)2. 病态条件(Ill-Conditioning)3. 参数初始化不当4. …
建站知识
2025/3/7 5:10:02
【Python项目】基于深度学习的电影评论情感分析系统
【Python项目】基于深度学习的电影评论情感分析系统
技术简介:采用Python技术、Flask框架、MySQL数据库、Word2Vec模型等实现。
系统简介:该系统基于深度学习技术,特别是Word2Vec模型,用于分析电影评论的情感倾向。系统分为前台…
建站知识
2025/3/7 5:07:59