0898-08980898
的特点,在汽车、制造、医药、六西格玛等领域应用广泛,核心优势是能快速从数据中挖掘规律,支持从描述性分析到高级建模的全流程,且操作比纯代码工具更便捷。以下整理分类,标注适用场景、操作路径和核心用途,适配工业、科研、数据分析等日常需求:
是所有分析的基础,用于快速了解数据分布、缺失值、异常值,验证数据合理性。
:单变量分析,生成直方图、箱线图、茎叶图,计算均值 / 中位数 / 标准差 / 四分位数,检验数据是否符合正态分布(Shapiro-Wilk/KS 检验),识别异常值(箱线图离群点)。
:快速掌握关键指标(如尺寸、良率、工时)的分布特征,判断数据是否满足后续参数分析的前提(如正态性)。
:多变量相关性分析,生成相关系数矩阵、散点图矩阵,可视化变量间的线性关系,识别多重共线性。
:探索多个影响因素(如温度、压力、转速)与输出指标(如产品强度)的相关性,为后续建模筛选变量。
:灵活的交叉统计,支持按分类变量(如产线、班次、供应商)分组,计算计数、均值、求和、占比等,可直接生成汇总表并可视化。
:按维度统计数据(如各产线良率、各班次工时、各供应商来料合格率),快速做分层对比。
用于判断不同分组 / 水平的指标是否存在显著差异,是工业中 “对比试验 / 分组验证” 的核心方法。
:判断不同班次的产品尺寸是否有差异、不同原料批次的性能是否一致、某参数 3 个水平下的输出是否不同。
:多因素对比试验,如分析 “产线 + 原料 + 工艺参数” 对良率的综合影响。
用于配对样本(如同一批次产品处理前 / 后的指标、同一设备校准前 / 后的数据)。
:简单的两组对比,如验证新工艺是否比旧工艺提升良率、校准后设备精度是否改善。
用于构建输入因子(X)与输出响应(Y)的数学模型,实现预测和关键因子识别,是六西格玛 DMAIC 中 “分析阶段” 的核心方法。
:构建线+…),检验因子的显著性,计算决定系数(R²)评估模型拟合度,通过逐步回归 / 向前 / 向后筛选关键因子。
:输入因子与输出为线性关系的建模,如通过 “温度、压力、转速” 预测产品 “抗拉强度”,识别对强度影响最大的因子。
:当 X 与 Y 为非线性关系(如指数、对数、多项式关系)时,构建非线性拟合模型,自定义模型公式适配实际业务规律。
:如电池容量随使用时间的衰减、化学反应速率随温度的变化、产品磨损率随使用时长的变化。
中,是线性回归的多因子版本,核心用于多 X 对单 Y 的建模与预测,JMP 支持自动筛选因子、检验共线性。
适配汽车、机械、电子等制造业的过程稳定性监控、缺陷分析、工艺优化,与 VDA6.3、IATF16949、六西格玛高度契合。
:计量型(Xbar-R、Xbar-S、I-MR)、计数型(P 图、NP 图、C 图、U 图)、进阶型(EWMA、CUSUM,适用于小波动检测)。
:监控过程是否处于统计受控状态,识别特殊原因变异(如失控点、趋势、周期性变化),是 SPC(统计过程控制)的核心工具。
:产线日常质量监控(如零件尺寸的 Xbar-R 图、成品缺陷数的 C 图)、设备加工稳定性监控。
:偏倚(Bias)、线性(Linearity)、重复性和再现性(GRR,含交叉型 / 嵌套型)、稳定性(Stability)。
:评估测量系统的准确性(偏倚、线性)和精密性(GRR),判断测量误差是否在可接受范围,确保测量数据可靠。
:新量具校准后验证、现有测量系统定期审核、测量数据异常时的根因分析(如判断是过程问题还是测量问题)。
: 全因子设计:检验所有因子及交互效应,适用于因子少(≤3)、水平少的场景; 部分因子设计(筛选设计):快速筛选关键因子,适用于因子多(≥5)的初步筛选; 响应面设计(RSM):优化工艺参数,找到使响应变量最优的 X 组合(如最大良率、最小缺陷)。
:高效的工艺优化,通过有计划的试验替代单因子试验,减少试验次数,精准识别关键因子及最优参数区间。
:新产品工艺开发、现有产线良率提升、缺陷率降低的参数优化(如半导体、汽车零部件的工艺调试)。
:可视化根因分析,按人、机、料、法、环、测(5M1E)分类梳理影响问题的潜在因子,是 QC 七大工具之一。
:缺陷问题的根因分析(如产品不良、良率偏低、设备故障),六西格玛 DMAIC 的 “定义 / 分析阶段”。
适用于基础方法无法解决的复杂场景,如非正态数据、分类输出、大数据集的维度压缩。
:当数据不满足正态分布时,替代参数检验(如 ANOVA/t 检验),包括 Wilcoxon 秩和检验(双组)、Kruskal-Wallis 检验(多组)。
(如合格 / 不合格、良品 / 不良品、达标 / 未达标)时,构建回归模型,识别影响分类结果的关键因子,实现分类预测。
:预测产品是否合格(基于工艺参数)、判断客户是否流失(基于运营数据)、识别缺陷发生的关键因子。
:维度压缩,将多个高度相关的变量转化为少数几个不相关的主成分 / 公因子,减少变量个数,简化后续建模,同时保留数据核心信息。
:多变量且存在严重多重共线性的数据集(如化工工艺的 10 个监测指标、汽车零部件的 8 个尺寸指标)。
:自由拖拽变量构建个性化可视化图形(散点图、折线图、柱状图、热力图等),支持多图层叠加,快速实现复杂可视化;
:交互式筛选数据,实时联动图形和分析结果,快速做分层分析(如筛选某产线、某班次的数据重新分析);