招标
南京古生物所MATLAB2022a(永久许可)软件询价公告
金额
-
项目地址
江苏省
发布时间
2022/04/25
公告摘要
公告正文
中国科学院南京地质古生物研究所拟购买MATLAB 2022a(永久许可)软件一套(含Optimization Toolbox、Statistics and Machine Learning Toolbox两个工具箱),具体要求如下:
1. 主要参数:
1.1 MATLAB 2022a:
MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,MATLAB还可以用来创建用户界面及与调用其它语言(包括C、C++、Java、Python和FORTRAN)编写的程序。
主要功能包括:
1.1.1 可用于技术计算的高级语言;
1.1.2 可对代码、文件和数据进行管理的开发环境;
1.1.3 可以按迭代的方式探查、设计及求解问题的交互式工具;
1.1.4 可用于线性代数、统计、傅立叶分析、筛选、优化以及数值积分等的数学函数;
1.1.5 可用于可视化数据的二维和三维图形函数;
1.1.6 可用于构建自定义的图形用户界面的各种工具;
1.1.7 可将基于MATLAB的算法与外部应用程序和语言(如C、C++、Fortran、Java、COM以及Microsoft Excel)集成的各种函数;
1.1.8 可以通过附加的工具箱(Toolbox)进行功能扩展。
1.2 工具箱(Toolbox) Optimization Toolbox 2022a:
提供各种函数,可用于求最小化或最大化目标且满足约束的参数。包含用于线性规划 (LP)、混合整数线性规划 (MILP)、二次规划 (QP)、二阶锥规划 (SOCP)、非线性规划 (NLP)、约束线性最小二乘、非线性最小二乘和非线性方程的求解器。
可以用函数和矩阵来定义优化问题,也可以通过指定反映底层数学关系的变量表达式来定义。使用目标函数和约束函数自动微分,更快、更准确地求解。
可提供求解器求连续与离散问题的最优解、执行权衡分析,并将优化方法整合到算法和应用中。能够执行设计优化任务,包括参数估计、分量选择和参数调整。在投资组合优化、能源管理和交易以及生产规划等各种应用中求最优解。
1.2.1 定义优化问题
将设计或决策问题建模为优化问题。将设计参数或决策方案设置为优化变量。使用它们定义要优化的目标函数,并使用约束来限定可能的变量值。
1.2.1.1 建模
通过定义变量、目标和约束,将问题描述转换为数学表达,从而运用优化方法求解。
1.2.1.2 基于问题的优化
将目标和约束写作优化变量表达式。对非线性表达式运用自动微分,更快、更稳健地求解。应用自动选择的求解器。
1.2.1.3 基于求解器的优化
将非线性目标和约束写作函数,将线性目标和约束写作系数矩阵。使用实时编辑器中的“优化”任务以交互方式创建并求解问题,然后生成代码,以便与他人共享或整合到应用。
1.2.2 求解优化问题
应用求解器处理优化问题,确定最优解,即一组优化变量值,可实现目标函数最优值(如有)且满足约束(如有)。
1.2.2.1 选择求解器
使用基于求解器的方法时,实时编辑器中的“优化”任务可帮助选择适合该类问题的求解器。在基于问题的方法中,会自动选择求解器。
1.2.2.2 设置选项
设置优化选项以调整优化过程,例如选择求解器使用的优化算法,或设置终止条件。设置选项以监控并绘制优化求解器进度。
1.2.2.3 查看并改进结果
查看退出消息、最优性度量和迭代输出,对解进行评估。提高求解器处理非线性问题的性能,可以使用自动微分、直接提供梯度,或使用并行计算估计梯度。
1.2.3 求解具有非线性目标或非线性约束的优化问题。
1.2.3.1 求解器
应用拟牛顿法、信赖域法或 Nelder-Mead 单纯形算法求解无约束问题。应用内点、序列二次规划 (SQP) 或信赖域反射算法求解约束问题。
1.2.3.2 应用
将非线性优化用于变量间存在非线性关系的各种应用,如估计和调整参数、寻找最优设计、计算最优轨迹、构建稳健投资组合等。
1.2.4 线性、二次和锥规划
求解具有线性或二次目标且具有线性或二阶锥约束的凸优化问题。
1.2.4.1 线性规划求解器
应用对偶单纯形或内点算法求解线性规划。
1.2.4.2 二次和二阶锥规划求解器
应用内点、活动集或信赖域反射算法来求解二次规划。应用内点法求解二阶锥规划。
1.2.4.3 应用
使用线性规划求解问题,如资源分配、生产规划、配料及投资规划。使用二次和二阶锥规划,求解设计优化、投资组合优化及水电站大坝的控制等问题。
1.2.5 混合整数线性规划
求解具有线性目标和线性约束、且另有约束规定部分或全部变量必须为整数值的优化问题。
1.2.5.1 求解器
使用分支定界算法求解混合整数线性规划问题,包含预处理、使用启发式方法生成可行点,以及割平面。
1.2.5.2 基于混合整数线性规划的算法
使用混合整数线性规划求解器构建专用算法。
1.2.5.3 应用
使用整数变量建模,求解开/关决策、逻辑约束以及其他变量值必须为整数的问题。路由、调度、规划、分配及资本预算问题均为典型应用。
1.2.6 多目标优化
求解具有多个目标函数和一组约束的优化问题。
1.2.6.1 求解器
将问题构造为目标达到问题或极小化极大问题。当每个目标均有权重可选的加权目标值时,使用目标达到。需要最小化一组目标函数的最差情形值时,使用极小化极大。
1.2.6.2 应用
当需要对冲突目标做出权衡时,使用多目标优化算法。例如,结构设计中的重量与强度,以及投资组合优化中的风险与回报。
1.2.7 最小二乘和方程求解
求解非线性最小二乘问题和具有边界约束的非线性方程组。求解具有边界和线性约束的线性最小二乘问题。
1.2.7.1 求解器
应用 Levenberg-Marquardt、信赖域、活动集或内点算法。
1.2.7.2 线性最小二乘应用
使用线性最小二乘求解器,可以对采集的数据进行线性模型拟合,或者求解线性方程组,包括参数具有边界和线性约束的情形。
1.2.7.3 非线性最小二乘应用
使用非线性最小二乘求解器,可以对采集的数据进行非线性模型拟合,或者求解非线性方程组,包括参数具有边界约束的情形。
1.2.8 部署
构建基于优化的决策支持和设计工具,与企业系统进行集成,并将优化算法部署到嵌入式系统中。
1.2.8.1 MATLAB Compiler 支持
使用 MATLAB Compiler? 和 MATLAB Compiler SDK?,可将 MATLAB? 优化模型部署为独立可执行文件、Web App、C++ 共享库、Microsoft? .NET 程序集、Java? 类和 Python? 包。
1.2.8.2 代码生成
使用 MATLAB Coder? 生成可移植且可读的 C 或 C++ 代码,以求解优化问题。为包括嵌入式系统在内的各种硬件编译生成的代码。
1.2.9 其他
1.2.9.1 实时编辑器中的“优化”任务
以交互方式创建和求解优化问题
1.2.9.2 自动微分
使用自动计算的目标函数和约束函数梯度,更快速更准确地求解问题
1.2.9.3 二阶锥规划
求解具有二阶锥约束、线性约束和线性目标的凸优化问题
1.3 工具箱(Toolbox) Statistics and Machine Learning Toolbox 2022a:
可提供一系列函数和 App,可用于数据描述、分析和建模。可以使用描述性统计量、可视化和聚类进行探索性数据分析;对数据进行概率分布拟合;生成用于蒙特卡罗模拟的随机数,以及执行假设检验。提供回归和分类算法,可以基于数据进行推断并构建预测模型;可选择分类学习器和回归学习器进行交互式操作,可使用 AutoML 以编程方式操作。
针对多维数据分析和特征提取,可提供主成分分析 (PCA)、正则化、降维和特征选择方法,能够识别预测能力最强的变量。
提供有监督、半监督和无监督机器学习算法,包括支持向量机 (SVM)、提升决策树、k 均值和其他聚类方法。可以应用可解释性方法(例如部分依赖图和 LIME),并自动生成 C/C++ 代码以进行嵌入式部署。算法同样适用于无法存储到内存的大型数据集。
1.3.1 探索性数据分析
使用包含交互式图形的统计绘图以及描述性统计量,对数据进行探查。使用聚类识别模式和特征。
1.3.1.1 可视化
使用概率图、箱线图、直方图、分位数-分位数图(Q-Q 图)以及用于多元分析的高级绘图(如树状图、双标图和 Andrews 图),以直观方式探查数据。
1.3.1.2 描述性统计量
使用少量关联性强的关键数值,快速理解和描述可能较大的数据集。
1.3.1.3 聚类分析
通过使用 k 均值、k 中心点、DBSCAN、分层聚类和谱聚类、高斯混合和隐马尔可夫模型对数据分组来发现规律。
1.3.2 特征提取和降维
将原始数据转化为最适合机器学习的特征。以迭代方式探查和创建新特征,并选择有助于优化性能的特征。
1.3.2.1 特征提取
使用无监督学习方法(如稀疏滤波和重构 ICA)从数据中提取特征。还可以使用专门的方法,从图像、信号、文本和数值数据中提取特征。
1.3.2.2 特征选择
自动识别数据建模中预测能力最强的特征子集。特征选择方法包括逐步回归、序列特征选择、正则化和集成法。
1.3.2.3 特征变换和降维
将现有(非分类)特征变换为新的预测变量以实现降维,这些新变量丢弃的描述性特征较少。特征变换方法包括 PCA、因子分析和非负矩阵分解。
1.3.3 机器学习
使用交互式 App 或自动化机器学习 (AutoML) 构建预测性分类和回归模型。自动选择特征、识别最佳模型并调优超参数。
1.3.3.1 训练、验证和调优预测模型
比较各种机器学习算法,选择特征,调优超参数,并评估多种常用分类和回归算法的性能。使用交互式 App 构建和自动优化预测模型,并使用流数据以增量方法改进模型。
1.3.3.2 模型可解释性
运用成熟的可解释性方法提高黑盒机器学习模型的可解释性,包括部分依赖图、个体条件期望 (ICE) 以及与模型无关的局部可解释性解释 (LIME)。
1.3.3.3 自动化机器学习 (AutoML)
自动调优超参数、选择特征和模型、使用成本矩阵处理数据集不平衡,从而提高模型性能。
1.3.4 回归和方差分析
使用线性和非线性回归、混合效应模型、广义线性模型和非参数化回归,将一个连续响应变量建模为一个或多个预测变量的函数。使用方差分析将方差分配到不同的源。
1.3.4.1 线性和非线性回归
基于多种线性和非线性回归算法选择多个预测变量或响应变量,对复杂系统的行为建模。拟合具有嵌套和/或交叉随机效应的多层或分层、线性、非线性和广义线性混合效应模型,以便进行纵向或面板分析、重复测量和成长建模。
1.3.4.2 非参数化回归
使用 SVM、随机森林、高斯过程和高斯核,无需指定模型来描述预测变量与响应之间关系,即可生成准确的拟合。
1.3.4.3 方差分析 (ANOVA)
将样本方差指定给不同的源,然后确定方差产生于总体组内还是组间。使用单因素、双因素、多因素、多变量和非参数化方差分析,以及协方差分析 (ANOCOVA) 和重复测量方差分析 (RANOVA)。
1.3.5 概率分布和假设检验
将数据拟合到分布。分析样本间差异是否显著,或者是否在随机数据变化下保持稳定。生成服从各种分布的随机数。
1.3.5.1 概率分布
进行连续和离散概率分布拟合,使用统计绘图来评估拟合优度,计算 40 多种不同分布的概率密度函数和累积分布函数。
1.3.5.2 随机数生成
利用拟合或构建的概率分布生成伪随机和准随机数流。
1.3.5.3 假设检验
执行单样本、配对样本或独立样本 t 检验、分布检验(卡方、Jarque-Bera、Lilliefors 和 Kolmogorov-Smirnov)和非参数检验。检验自动校正和随机性,并比较分布(双样本 Kolmogorov-Smirnov)。
1.3.6 工业统计
用统计方法分析影响和数据趋势。应用工业统计方法,例如自定义的试验设计和统计过程控制。
1.3.6.1 试验设计 (DOE)
定义、分析和可视化自定义的 DOE。就如何操作关联式数据输入创建现实计划并加以测试,获取有关计划对数据输出所产生影响的信息。
1.3.6.2 统计过程控制 (SPC)
评估过程变异以监控和改进产品或过程。创建控制图,估计过程能力,执行计量可重复性和可再现性研究。
1.3.6.3 可靠性和生存分析
执行 Cox 比例风险回归和分布拟合,对带删失或不带删失的失效时间数据进行可视化和分析。计算经验风险、生存、累积分布函数以及核密度估计。
1.3.7 大数据、并行化和云计算
对超出内存的数据应用统计和机器学习方法。通过并行化加快针对集群和云实例的统计计算和机器学习模型训练速度。
1.3.7.1 使用 Tall 数组分析大数据
在多种分类、回归和聚类算法中运用 Tall 数组和 Tall 表,以便基于无法放入内存的数据集训练模型,而无需更改代码。
1.3.7.2 并行计算
通过并行化加快统计计算和模型训练速度。
1.3.7.3 云和分布式计算
使用云实例加快统计和机器学习计算速度。在 MATLAB Online? 中执行完整的机器学习工作流程。
1.3.8 部署、代码生成和 Simulink 集成
将统计和机器学习部署到嵌入式系统,使用 C 代码加速计算密集型运算,并与企业系统和 Simulink 模型集成。
1.3.8.1 代码生成
使用 MATLAB Coder? 为分类和回归算法的推断、描述性统计量和概率分布生成可移植、可读的 C 或 C++ 代码。使用 Fixed Point Designer? 生成降精度的 C/C++ 预测代码,并在不重新生成预测代码的情况下更新已部署模型的参数。
1.3.8.2 与 Simulink 集成
将机器学习模型与 Simulink 模型相集成,以部署到嵌入式硬件或用于系统仿真、验证和确认。
1.3.8.3 与应用程序和企业系统集成
使用 MATLAB Compiler?,将统计和机器学习模型部署为独立应用程序、MapReduce 或 Spark? 应用程序、Web App 或者 Microsoft? Excel? 插件。使用 MATLAB Compiler SDK?,构建 C/C++ 共享库、Microsoft .NET 程序集、Java? 类和 Python? 程序包。
1.3.9 其他
1.3.9.1 AutoML
自动选择最佳模型和相关超参数以进行回归 (fitrauto)
1.3.9.2可解释性
获取与模型无关的局部可解释性解释 (LIME)
1.3.9.3 SVM 预测模块
在 Simulink 中仿真 SVM 模型并生成代码
1.3.9.4 增量学习
增量式训练线性回归和二类分类模型
1.3.9.5 半监督学习
使用图和自训练模型(fitsemigraph、fitsemiself),根据部分类标签外推至整个数据集
1.3.9.6 代码生成
为预测生成单精度 C/C++ 代码
2. 售后服务和培训:
产品最新更新(每年发布两次,打包新功能和性能改进);
可通过电话、电子邮件和网站获得技术支持提供 10 种语言的服务;
MATLAB Online、MATLAB Drive 和 MATLAB Mobile 等在线产品和云服务
3. 交货时间地点:
交货时间:签订合同后7天内。
交货地点:南京市北京东路39号中国科学院南京地质古生物研究所。
欢迎有供货意向的经销商或代理商于2022年4月29日下午5:00前将营业执照、税务登记证、投标产品彩页和报价材料纸质版盖章密封后提交至中国科学院南京地质古生物研究所国资行政与财务处(行政楼103室)。封面注明项目名称、单位名称及联系方式,密封处需加盖单位公章。
联系人:蔡老师 025-83282234(技术);许老师 025-83282115。
地址:江苏省南京市北京东路39号。
1. 主要参数:
1.1 MATLAB 2022a:
MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,MATLAB还可以用来创建用户界面及与调用其它语言(包括C、C++、Java、Python和FORTRAN)编写的程序。
主要功能包括:
1.1.1 可用于技术计算的高级语言;
1.1.2 可对代码、文件和数据进行管理的开发环境;
1.1.3 可以按迭代的方式探查、设计及求解问题的交互式工具;
1.1.4 可用于线性代数、统计、傅立叶分析、筛选、优化以及数值积分等的数学函数;
1.1.5 可用于可视化数据的二维和三维图形函数;
1.1.6 可用于构建自定义的图形用户界面的各种工具;
1.1.7 可将基于MATLAB的算法与外部应用程序和语言(如C、C++、Fortran、Java、COM以及Microsoft Excel)集成的各种函数;
1.1.8 可以通过附加的工具箱(Toolbox)进行功能扩展。
1.2 工具箱(Toolbox) Optimization Toolbox 2022a:
提供各种函数,可用于求最小化或最大化目标且满足约束的参数。包含用于线性规划 (LP)、混合整数线性规划 (MILP)、二次规划 (QP)、二阶锥规划 (SOCP)、非线性规划 (NLP)、约束线性最小二乘、非线性最小二乘和非线性方程的求解器。
可以用函数和矩阵来定义优化问题,也可以通过指定反映底层数学关系的变量表达式来定义。使用目标函数和约束函数自动微分,更快、更准确地求解。
可提供求解器求连续与离散问题的最优解、执行权衡分析,并将优化方法整合到算法和应用中。能够执行设计优化任务,包括参数估计、分量选择和参数调整。在投资组合优化、能源管理和交易以及生产规划等各种应用中求最优解。
1.2.1 定义优化问题
将设计或决策问题建模为优化问题。将设计参数或决策方案设置为优化变量。使用它们定义要优化的目标函数,并使用约束来限定可能的变量值。
1.2.1.1 建模
通过定义变量、目标和约束,将问题描述转换为数学表达,从而运用优化方法求解。
1.2.1.2 基于问题的优化
将目标和约束写作优化变量表达式。对非线性表达式运用自动微分,更快、更稳健地求解。应用自动选择的求解器。
1.2.1.3 基于求解器的优化
将非线性目标和约束写作函数,将线性目标和约束写作系数矩阵。使用实时编辑器中的“优化”任务以交互方式创建并求解问题,然后生成代码,以便与他人共享或整合到应用。
1.2.2 求解优化问题
应用求解器处理优化问题,确定最优解,即一组优化变量值,可实现目标函数最优值(如有)且满足约束(如有)。
1.2.2.1 选择求解器
使用基于求解器的方法时,实时编辑器中的“优化”任务可帮助选择适合该类问题的求解器。在基于问题的方法中,会自动选择求解器。
1.2.2.2 设置选项
设置优化选项以调整优化过程,例如选择求解器使用的优化算法,或设置终止条件。设置选项以监控并绘制优化求解器进度。
1.2.2.3 查看并改进结果
查看退出消息、最优性度量和迭代输出,对解进行评估。提高求解器处理非线性问题的性能,可以使用自动微分、直接提供梯度,或使用并行计算估计梯度。
1.2.3 求解具有非线性目标或非线性约束的优化问题。
1.2.3.1 求解器
应用拟牛顿法、信赖域法或 Nelder-Mead 单纯形算法求解无约束问题。应用内点、序列二次规划 (SQP) 或信赖域反射算法求解约束问题。
1.2.3.2 应用
将非线性优化用于变量间存在非线性关系的各种应用,如估计和调整参数、寻找最优设计、计算最优轨迹、构建稳健投资组合等。
1.2.4 线性、二次和锥规划
求解具有线性或二次目标且具有线性或二阶锥约束的凸优化问题。
1.2.4.1 线性规划求解器
应用对偶单纯形或内点算法求解线性规划。
1.2.4.2 二次和二阶锥规划求解器
应用内点、活动集或信赖域反射算法来求解二次规划。应用内点法求解二阶锥规划。
1.2.4.3 应用
使用线性规划求解问题,如资源分配、生产规划、配料及投资规划。使用二次和二阶锥规划,求解设计优化、投资组合优化及水电站大坝的控制等问题。
1.2.5 混合整数线性规划
求解具有线性目标和线性约束、且另有约束规定部分或全部变量必须为整数值的优化问题。
1.2.5.1 求解器
使用分支定界算法求解混合整数线性规划问题,包含预处理、使用启发式方法生成可行点,以及割平面。
1.2.5.2 基于混合整数线性规划的算法
使用混合整数线性规划求解器构建专用算法。
1.2.5.3 应用
使用整数变量建模,求解开/关决策、逻辑约束以及其他变量值必须为整数的问题。路由、调度、规划、分配及资本预算问题均为典型应用。
1.2.6 多目标优化
求解具有多个目标函数和一组约束的优化问题。
1.2.6.1 求解器
将问题构造为目标达到问题或极小化极大问题。当每个目标均有权重可选的加权目标值时,使用目标达到。需要最小化一组目标函数的最差情形值时,使用极小化极大。
1.2.6.2 应用
当需要对冲突目标做出权衡时,使用多目标优化算法。例如,结构设计中的重量与强度,以及投资组合优化中的风险与回报。
1.2.7 最小二乘和方程求解
求解非线性最小二乘问题和具有边界约束的非线性方程组。求解具有边界和线性约束的线性最小二乘问题。
1.2.7.1 求解器
应用 Levenberg-Marquardt、信赖域、活动集或内点算法。
1.2.7.2 线性最小二乘应用
使用线性最小二乘求解器,可以对采集的数据进行线性模型拟合,或者求解线性方程组,包括参数具有边界和线性约束的情形。
1.2.7.3 非线性最小二乘应用
使用非线性最小二乘求解器,可以对采集的数据进行非线性模型拟合,或者求解非线性方程组,包括参数具有边界约束的情形。
1.2.8 部署
构建基于优化的决策支持和设计工具,与企业系统进行集成,并将优化算法部署到嵌入式系统中。
1.2.8.1 MATLAB Compiler 支持
使用 MATLAB Compiler? 和 MATLAB Compiler SDK?,可将 MATLAB? 优化模型部署为独立可执行文件、Web App、C++ 共享库、Microsoft? .NET 程序集、Java? 类和 Python? 包。
1.2.8.2 代码生成
使用 MATLAB Coder? 生成可移植且可读的 C 或 C++ 代码,以求解优化问题。为包括嵌入式系统在内的各种硬件编译生成的代码。
1.2.9 其他
1.2.9.1 实时编辑器中的“优化”任务
以交互方式创建和求解优化问题
1.2.9.2 自动微分
使用自动计算的目标函数和约束函数梯度,更快速更准确地求解问题
1.2.9.3 二阶锥规划
求解具有二阶锥约束、线性约束和线性目标的凸优化问题
1.3 工具箱(Toolbox) Statistics and Machine Learning Toolbox 2022a:
可提供一系列函数和 App,可用于数据描述、分析和建模。可以使用描述性统计量、可视化和聚类进行探索性数据分析;对数据进行概率分布拟合;生成用于蒙特卡罗模拟的随机数,以及执行假设检验。提供回归和分类算法,可以基于数据进行推断并构建预测模型;可选择分类学习器和回归学习器进行交互式操作,可使用 AutoML 以编程方式操作。
针对多维数据分析和特征提取,可提供主成分分析 (PCA)、正则化、降维和特征选择方法,能够识别预测能力最强的变量。
提供有监督、半监督和无监督机器学习算法,包括支持向量机 (SVM)、提升决策树、k 均值和其他聚类方法。可以应用可解释性方法(例如部分依赖图和 LIME),并自动生成 C/C++ 代码以进行嵌入式部署。算法同样适用于无法存储到内存的大型数据集。
1.3.1 探索性数据分析
使用包含交互式图形的统计绘图以及描述性统计量,对数据进行探查。使用聚类识别模式和特征。
1.3.1.1 可视化
使用概率图、箱线图、直方图、分位数-分位数图(Q-Q 图)以及用于多元分析的高级绘图(如树状图、双标图和 Andrews 图),以直观方式探查数据。
1.3.1.2 描述性统计量
使用少量关联性强的关键数值,快速理解和描述可能较大的数据集。
1.3.1.3 聚类分析
通过使用 k 均值、k 中心点、DBSCAN、分层聚类和谱聚类、高斯混合和隐马尔可夫模型对数据分组来发现规律。
1.3.2 特征提取和降维
将原始数据转化为最适合机器学习的特征。以迭代方式探查和创建新特征,并选择有助于优化性能的特征。
1.3.2.1 特征提取
使用无监督学习方法(如稀疏滤波和重构 ICA)从数据中提取特征。还可以使用专门的方法,从图像、信号、文本和数值数据中提取特征。
1.3.2.2 特征选择
自动识别数据建模中预测能力最强的特征子集。特征选择方法包括逐步回归、序列特征选择、正则化和集成法。
1.3.2.3 特征变换和降维
将现有(非分类)特征变换为新的预测变量以实现降维,这些新变量丢弃的描述性特征较少。特征变换方法包括 PCA、因子分析和非负矩阵分解。
1.3.3 机器学习
使用交互式 App 或自动化机器学习 (AutoML) 构建预测性分类和回归模型。自动选择特征、识别最佳模型并调优超参数。
1.3.3.1 训练、验证和调优预测模型
比较各种机器学习算法,选择特征,调优超参数,并评估多种常用分类和回归算法的性能。使用交互式 App 构建和自动优化预测模型,并使用流数据以增量方法改进模型。
1.3.3.2 模型可解释性
运用成熟的可解释性方法提高黑盒机器学习模型的可解释性,包括部分依赖图、个体条件期望 (ICE) 以及与模型无关的局部可解释性解释 (LIME)。
1.3.3.3 自动化机器学习 (AutoML)
自动调优超参数、选择特征和模型、使用成本矩阵处理数据集不平衡,从而提高模型性能。
1.3.4 回归和方差分析
使用线性和非线性回归、混合效应模型、广义线性模型和非参数化回归,将一个连续响应变量建模为一个或多个预测变量的函数。使用方差分析将方差分配到不同的源。
1.3.4.1 线性和非线性回归
基于多种线性和非线性回归算法选择多个预测变量或响应变量,对复杂系统的行为建模。拟合具有嵌套和/或交叉随机效应的多层或分层、线性、非线性和广义线性混合效应模型,以便进行纵向或面板分析、重复测量和成长建模。
1.3.4.2 非参数化回归
使用 SVM、随机森林、高斯过程和高斯核,无需指定模型来描述预测变量与响应之间关系,即可生成准确的拟合。
1.3.4.3 方差分析 (ANOVA)
将样本方差指定给不同的源,然后确定方差产生于总体组内还是组间。使用单因素、双因素、多因素、多变量和非参数化方差分析,以及协方差分析 (ANOCOVA) 和重复测量方差分析 (RANOVA)。
1.3.5 概率分布和假设检验
将数据拟合到分布。分析样本间差异是否显著,或者是否在随机数据变化下保持稳定。生成服从各种分布的随机数。
1.3.5.1 概率分布
进行连续和离散概率分布拟合,使用统计绘图来评估拟合优度,计算 40 多种不同分布的概率密度函数和累积分布函数。
1.3.5.2 随机数生成
利用拟合或构建的概率分布生成伪随机和准随机数流。
1.3.5.3 假设检验
执行单样本、配对样本或独立样本 t 检验、分布检验(卡方、Jarque-Bera、Lilliefors 和 Kolmogorov-Smirnov)和非参数检验。检验自动校正和随机性,并比较分布(双样本 Kolmogorov-Smirnov)。
1.3.6 工业统计
用统计方法分析影响和数据趋势。应用工业统计方法,例如自定义的试验设计和统计过程控制。
1.3.6.1 试验设计 (DOE)
定义、分析和可视化自定义的 DOE。就如何操作关联式数据输入创建现实计划并加以测试,获取有关计划对数据输出所产生影响的信息。
1.3.6.2 统计过程控制 (SPC)
评估过程变异以监控和改进产品或过程。创建控制图,估计过程能力,执行计量可重复性和可再现性研究。
1.3.6.3 可靠性和生存分析
执行 Cox 比例风险回归和分布拟合,对带删失或不带删失的失效时间数据进行可视化和分析。计算经验风险、生存、累积分布函数以及核密度估计。
1.3.7 大数据、并行化和云计算
对超出内存的数据应用统计和机器学习方法。通过并行化加快针对集群和云实例的统计计算和机器学习模型训练速度。
1.3.7.1 使用 Tall 数组分析大数据
在多种分类、回归和聚类算法中运用 Tall 数组和 Tall 表,以便基于无法放入内存的数据集训练模型,而无需更改代码。
1.3.7.2 并行计算
通过并行化加快统计计算和模型训练速度。
1.3.7.3 云和分布式计算
使用云实例加快统计和机器学习计算速度。在 MATLAB Online? 中执行完整的机器学习工作流程。
1.3.8 部署、代码生成和 Simulink 集成
将统计和机器学习部署到嵌入式系统,使用 C 代码加速计算密集型运算,并与企业系统和 Simulink 模型集成。
1.3.8.1 代码生成
使用 MATLAB Coder? 为分类和回归算法的推断、描述性统计量和概率分布生成可移植、可读的 C 或 C++ 代码。使用 Fixed Point Designer? 生成降精度的 C/C++ 预测代码,并在不重新生成预测代码的情况下更新已部署模型的参数。
1.3.8.2 与 Simulink 集成
将机器学习模型与 Simulink 模型相集成,以部署到嵌入式硬件或用于系统仿真、验证和确认。
1.3.8.3 与应用程序和企业系统集成
使用 MATLAB Compiler?,将统计和机器学习模型部署为独立应用程序、MapReduce 或 Spark? 应用程序、Web App 或者 Microsoft? Excel? 插件。使用 MATLAB Compiler SDK?,构建 C/C++ 共享库、Microsoft .NET 程序集、Java? 类和 Python? 程序包。
1.3.9 其他
1.3.9.1 AutoML
自动选择最佳模型和相关超参数以进行回归 (fitrauto)
1.3.9.2可解释性
获取与模型无关的局部可解释性解释 (LIME)
1.3.9.3 SVM 预测模块
在 Simulink 中仿真 SVM 模型并生成代码
1.3.9.4 增量学习
增量式训练线性回归和二类分类模型
1.3.9.5 半监督学习
使用图和自训练模型(fitsemigraph、fitsemiself),根据部分类标签外推至整个数据集
1.3.9.6 代码生成
为预测生成单精度 C/C++ 代码
2. 售后服务和培训:
产品最新更新(每年发布两次,打包新功能和性能改进);
可通过电话、电子邮件和网站获得技术支持提供 10 种语言的服务;
MATLAB Online、MATLAB Drive 和 MATLAB Mobile 等在线产品和云服务
3. 交货时间地点:
交货时间:签订合同后7天内。
交货地点:南京市北京东路39号中国科学院南京地质古生物研究所。
欢迎有供货意向的经销商或代理商于2022年4月29日下午5:00前将营业执照、税务登记证、投标产品彩页和报价材料纸质版盖章密封后提交至中国科学院南京地质古生物研究所国资行政与财务处(行政楼103室)。封面注明项目名称、单位名称及联系方式,密封处需加盖单位公章。
联系人:蔡老师 025-83282234(技术);许老师 025-83282115。
地址:江苏省南京市北京东路39号。
返回顶部