清荷月下猫的博客_LLM_Basis,Quant,RL

Quant-Ch06 量化调仓策略

Ch6 量化调仓策略6.1 衡量投资组合的收益率投资组合的收益率是指投资组合在一定时间内的总体收益率。投资组合的收益率可以通过加权平均每个资产的收益率来计算。具体地，假设投资组合中有n个资产，每个资产的收益率为r1, r2, ..., rn，每个资产的权重为w1, w2, ..., wn，则投资组合的收益率为：其中，权重wi表示资产i在投资组合中的占比，满足w1 + w2 + ... +

量化

策略

Quant

原创 7月前 110 阅读

RL5 PPO算法

PPO算法算法是一类典型的算法，既适用于连续动作空间，也适用于离散动作空间。算法是一种基于策略梯度的强化学习算法，由的研究人员等人在年提出。算法的主要思想是通过在策略梯度的优化过程中引入一个重要性权重来限制策略更新的幅度，从而提高算法的稳定性和收敛性。算法的优点在于简单、易于实现、易于调参，应用十分广泛，正可谓 “遇事不决 ”。算法的核心思想就是通过重要性采

强化学习

PPO

原创 7月前 154 阅读

Quant-Ch05 量化择时策略

Ch5 量化择时策略量化择时策略，就是采用数量化分析方法，利用单个或多个技术指标的组合，来对交易标的股票或股票指数进行低买高卖的操作，期望获得超越简单买入持有策略的收益风险表现。量化择时策略的核心是技术分析，更准确地来说，是客观型技术分析。客观型技术分析，是指其分析过程中所用到的分析方法，具有100%客观的定义标准，不含有任何主观定义的部分。5.1 量化择时的策略常见的客观性技术分析有：均

技术分析

Quant

量化

原创 7月前 90 阅读

书生·浦语大模型实战合集

D1-书生·浦语大模型全链路开源体系D2-InternLM-Chat-7B 智能对话 DemoD2-Lagent 智能体工具调用 DemoD2-浦语·灵笔图文理解创作 DemoInternLM智能创作Work及总结D3-基于InternLM和LangChain搭建知识库D4-XTuner 大模型单卡低成本微调自定义微调及用MS-Agent数据集赋予LLM以Agent能力XTuner InternL

大模型

实战

InternLM

原创 7月前 96 阅读

Quant-Ch04 量化选股策略

Ch4 量化选股策略证券市场在短期内的无效会使得一些有价值的股票出现较低的价格，而长期的有效会使得这些低价的股票回归到其应有的高价格，精准地选取到这些股票就能使交易者在这种低买高卖中获取超额收益。因此，使用量化交易的方式可以尽量帮助人们摆脱情绪对交易造成的消极影响，更客观地帮助投资者选取可能带来超额收益的股票。单/多因子选股模型效用模型与风险模型在经济学中，为了简化问题，假设每一个人都有一

量化

策略

原创 7月前 114 阅读

RL4 DDPG、TD3算法

DDPG 深度确定性策略梯度算法（），是一种确定性的策略梯度算法。算法在算法的基础上，再结合一些技巧，这些技巧既包括算法中也用到的目标网络、经验回放等，也包括引入噪声来增加策略的探索性。这里讲讲引入的噪声。其实引入噪声的方法在前面算法中就讲到了，只是算法是在网络中引入噪声，而算法是在输出动作上引入噪声，同策略类似。本质上来讲，引入噪声的作用就是为了在不破坏系统的前

损失函数

强化学习

算法

原创 7月前 121 阅读

Quant-Ch03 股票数据获取

3.1 技术面数据技术面数据是通过股票的历史价格和交易量等市场数据进行计算和分析得出的指标。它的核心观点是市场行为会在价格上留下痕迹，通过这些痕迹可以预测未来的价格走势。技术面数据主要关注股票价格的变动和市场趋势，常用的技术指标包括移动平均线、相对强弱指标、MACD指标等。技术面分析认为市场上已有的信息都会反映在股票价格中，因此通过分析股票价格图表和技术指标，可以尽可能准确地判断价格的走势和市

数据

Quant

量化

原创 7月前 95 阅读

RL3 深度学习基础、DQN算法、DQN算法进阶

深度学习基础1、化学习与深度学习的关系强化学习解决的是序列决策问题，而深度学习解决的是“打标签”问题，即给定一张图片，我们需要判断这张图片是猫还是狗，这里的猫和狗就是标签，当然也可以让算法自动打标签，这就是监督学习与无监督学习的区别。而强化学习解决的是“打分数”问题，即给定一个状态，我们需要判断这个状态是好还是坏，这里的好和坏就是分数。除了训练生成模型之外，强化学习相当于在深度学习的基础上增加了一

深度学习

强化学习

原创 7月前 196 阅读

D6-OpenCompass 大模型评测

测评结果使用 OpenCompass 评测 InternLM2-Chat-7B 模型在 C-Eval 数据集上的性能：python run.py --datasets ceval_gen --hf-path /share/temp/model_repos/internlm-chat-7b/ --tokenizer-path /share/temp/model_repos/internlm-chat

大模型

测评

OpenCompass

原创精选 7月前 811 阅读

RL2 免模型预测、免模型控制

免模型预测蒙特卡洛估计蒙特卡洛估计方法在强化学习中是免模型预测价值函数的方式之一，本质是一种统计模拟方法。蒙特卡洛方法主要分成两种算法，一种是首次访问蒙特卡洛（）方法，另外一种是每次访问蒙特卡洛（）方法。方法主要包含两个步骤，首先是产生一个回合的完整轨迹，然后遍历轨迹计算每个状态的回报。时序差分估计时序差分估计方法是一种基于经验的动态规划方法，它结合了蒙特卡洛和动态规划的思想。最简单的时

模型预测

强化学习

RL

原创精选 7月前 287 阅读

Quant-Ch02 金融市场

2.1 宏观经济学基础概念宏观经济分析及关键指标国内生产总值（Gross Domestic Product，简称GDP），是一个国家（或地区）所有常住单位在一定时期内生产活动的最终成果。GDP是国民经济核算的核心指标，也是衡量一个国家或地区经济状况和发展水平的重要指标。GDP增长率越高，代表经济发展越快，投资市场也越好。(1) 边际消费倾向MPC：增加的消费ΔC和增加的收入ΔY之间的比率，也就是增

Quant

Finance

Economics

原创 7月前 87 阅读

RL1 马尔可夫过程、动态规划

1 马尔可夫决策过程这里学习强化学习中最基本的问题模型，即马尔可夫决策过程，它能够以数学的形式来表达序列决策过程。智能体每一时刻都会接收环境的状态，并执行动作，进而接收到环境反馈的奖励信号和下一时刻的状态。这里马尔可夫决策过程。在介绍马尔可夫决策过程之前，我们先介绍它的简化版本：马尔可夫过程（Markov process，MP）以及马尔可夫奖励过程（Markov reward

迭代

决策过程

动态规划

原创精选 7月前 587 阅读

Quant-Ch01 投资与量化投资

1.1 量化投资量化投资是一种投资交易策略。量化投资策略是利用统计学、数学、信息技术、人工智能等方法取代人工作出决策，通过模型完成股票交易来构建投资组合。利用计算机技术和数学模型去实现投资策略的过程。一般情况下，市场研究、基本面分析、选股、择时、下单等都可以由计算机自动完成。广义上可以认为，凡是借助于数学模型和计算机实现的投资方法都可以称为量化投资。当前A股市场中，国内比较常见的量化投资方法

量化

原创 7月前 102 阅读

01-So-Large-LM

Task01 引言-大模型基础

语言模型

神经网络

概率分布

原创 7月前 175 阅读

D5-LMDeploy 大模型量化部署

〇、完成结果使用 LMDeploy 以本地对话部署 InternLM-Chat-7B 模型，生成 300 字的小故事：以API服务中的一种方式部署 InternLM-Chat-7B 模型，生成 300 字的小故事：以网页Gradio部署 InternLM-Chat-7B 模型，生成 300 字的小故事：前、知识笔记安装、部署、量化一、环境配置可以使用 vgpu-smi 查看显

大模型

量化

LMDeploy

原创精选 7月前 789 阅读

XTuner InternLM-Chat 个人小助手认知微调

〇完成结果1 环境准备bash conda create --name personal_assistant --clone=/root/share/conda_envs/internlm-base conda activate personal_assistant mkdir /root/personal_assistant && cd /root/personal_ass

大模型

微调

XTuner

原创 7月前 176 阅读 1收藏

自定义微调及用MS-Agent数据集赋予LLM以Agent能力

3 自定义微调以 Medication QA 数据集为例3.1 概述3.1.1 场景需求基于 InternLM-chat-7B 模型，用 MedQA 数据集进行微调，将其往医学问答领域对齐。3.1.2 真实数据预览问题答案What are ketorolac eye drops?（什么是酮咯酸滴眼液？）Ophthalmic ketorolac is used

大模型

微调

Xtuner

学习

原创 7月前 446 阅读

D4-XTuner 大模型单卡低成本微调

微调框架XTuner以及整个微调的工作流程。以InternLM为底座模型来进行微调。 Finetune简介XTuner介绍8GB显卡玩转LLM动手实战成功连接上了开发机。

大模型

实战

微调

学习

原创 7月前 299 阅读

D3-基于InternLM和LangChain搭建知识库

〇、完成结果这里最终完成结果如下：我们可以看到它可以很好地回答InternLM是什么。这一系列的内容是从我们从InternLM开源仓库里面所得到的内容，而不是大模型本身所具有的。即这里一整个过程来使模型能够调用我们本地的个人数据，从而实现一个个人知识库的组成。详细的搭建过程在本文接下来详细的讲解。先简要介绍目前的核心大模型的应用开发范式：输入文本转化为向量，然后在向量数据库中匹配相似文本，作为p

大模型

学习

实现

搭建

AI

原创 7月前 635 阅读 3评论

InternLM智能创作Work及总结

基础：使用 InternLM-Chat-7B 模型生成 300 字的小故事。详情可以见我的完成撰写文章：https://blog.51cto.com/morcake/9105322上图为进入的开始界面，下面即可进行问答：熟悉 hugging face 下载功能，使用 huggingface_hub python 包，下载 InternLM-20B 的 con

大模型

学习

InternLM

原创精选 7月前 339 阅读

D2-浦语·灵笔图文理解创作 Demo

这里我使用InternStudio中的 A100(1/4) * 2 机器和internlm-xcomposer-7b 模型部署一个图文理解创作 Demo 。一、环境准备选择 A100(1/4)*2 的配置：打开刚刚租用服务器的进入开发机，并在终端输入 bash 命令，进入 conda 环境，接下来就是安装依赖。进入 conda

大模型

开源

人工智能

学习

原创精选 7月前 673 阅读

D2-Lagent 智能体工具调用 Demo

现在还是使用 InternStudio 中的 A100(1/4) 机器、InternLM-Chat-7B 模型和 Lagent 框架部署一个智能工具调用 Demo。Lagent 是一个轻量级、开源的基于大语言模型的智能体（agent）框架，支持用户快速地将一个大语言模型转变为多种类型的智能体，并提供了一些典型工具为大语言模型赋能。通过 Lagent

大模型

开源

人工智能

Lagent

原创精选 7月前 342 阅读

D2-InternLM-Chat-7B 智能对话 Demo

使用InternStudio中的 A100(1/4) 机器和InternLM-Chat-7B模型部署一个智能对话 Demo。一、环境准备进入 conda 环境：bash # 请每次使用 jupyter lab 打开终端时务必先执行 bash 命令进入 bash 中使用以下命令从本地克隆一个已有的 pytorch 2.0.1 的环境：conda create

bash

大模型

部署

开源

原创 7月前 318 阅读

D1-书生·浦语大模型全链路开源体系

大模型成为发展通用人工智能的重要途径。“书生·浦语”是商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型。业务场景简单，如通用对话，直接将模型拿过来，运用prompt engineering接入业务场景；部分微调，如LoRA；调用外部API，或与数据库交互 → 需要智能体；模型评测通过则上线，评测不通过需要在之前的微调中做迭代；模型部署问题：最少的资源来增加吞

人工智能

大模型

开源

原创 7月前 348 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

morcake的博客

Quant-Ch06 量化调仓策略

RL5 PPO算法

Quant-Ch05 量化择时策略

书生·浦语大模型实战合集

Quant-Ch04 量化选股策略

RL4 DDPG、TD3算法

Quant-Ch03 股票数据获取

RL3 深度学习基础、DQN算法、DQN算法进阶

D6-OpenCompass 大模型评测

RL2 免模型预测、免模型控制

Quant-Ch02 金融市场

RL1 马尔可夫过程、动态规划

Quant-Ch01 投资与量化投资

01-So-Large-LM

D5-LMDeploy 大模型量化部署

XTuner InternLM-Chat 个人小助手认知微调

自定义微调及用MS-Agent数据集赋予LLM以Agent能力

D4-XTuner 大模型单卡低成本微调

D3-基于InternLM和LangChain搭建知识库

InternLM智能创作Work及总结

D2-浦语·灵笔图文理解创作 Demo

D2-Lagent 智能体工具调用 Demo

D2-InternLM-Chat-7B 智能对话 Demo

D1-书生·浦语大模型全链路开源体系