最近在做机器学习相关的事情,但遇到了如下问题,导致训练出来的模型识别准确度一般

如何截取完整的波形图,请教一下各位(关于机器学习、特征提取、时间序列)

数据波形图如上图所示,我目前是通过滑动窗口来进行截取的,我的预期是截取下来的数据是红色框框的这种(两边平缓、中间波动较大),我目前的截取条件是超过阈值就自动截取

注:窗口大小是固定的

但由于条件可能过于单一,也有一定的概率截取到黑色框框的这种类型的数据

本人在数据分析和机器学习上,基本上是小白,问题描述可能也比较不专业,所以在此请教一下 V 友,这种时间序列的数据,应该如何进行特征提取

最新回复 (13)
  • ipwx4月前
    引用2
    不懂,红框和黑框有啥区别。

    你先想办法把你的场景讲清楚
  • AlwaysBee楼主4月前
    引用3
    @ipwx 红框部分截取下来的波形图,两边是比较平缓的,中间是波动较大的
    黑框截取的波形图,波动大的那部分,跑到末尾了,没有被完整截取
  • ipwx4月前
    引用4
    @AlwaysBee 哦,你是一个实时序列从左往右跑,然后检测是吧。。。这句话也是我看你上面这句话猜出来的,猜测你 “跑到末尾” 是这个意思。

    你的描述太不清晰了,我其实还是知之甚少,比如你的数据是什么、有什么性质。。。
  • AlwaysBee楼主4月前
    引用5
    ![]( https://s3.bmp.ovh/imgs/2024/07/24/1dafb7fdb9997217.png)

    https://s3.bmp.ovh/imgs/2024/07/24/1dafb7fdb9997217.png
    @ipwx

    帖子无法 append ,在这里补充一个图
    黑色框不是我想要的(由于达到阈值就开始截取了,但实际上是提前了),红色虚线框才是我想要截取的
  • ipwx4月前
    引用6
    @AlwaysBee 哦好像看懂你在说什么了。

    你加个卷积核吧,两边低中间高的卷积核。
  • ipwx4月前
    引用7
    另外你还是没有描述清楚。

    你这边有好几条序列,设为 S1[t] ... Sk[t] 这 k 条序列。

    所以你每一时刻 t 的波动大,这个波动到底指的是以下哪种定义:

    1. max(Si[t] - Sj[t]) 两两之差的最大值
    2. max(abs(Si[t] - Sj[t])) 两两之差的绝对值的最大值
    3. max(abs(Si[t])) 每条序列的绝对值的最大值

    到底是哪个啊?
    ----

    所以你真的还没描述清楚啊(心累
  • AlwaysBee楼主4月前
    引用8
    @ipwx 不好意思,因为在这方面确实不是专业的,所以描述也比较直白
    前面说的波动大,就是如图红框中间的波形图波动陡峭起伏大的意思

    X 轴是时间,然后 Y 轴有三个数据(体现在波形图就是有三条不同颜色的折线图),随着时间会变化,并且是随着时间不断产生数据

    我需要做的是,将红框内这样的数据提取出来,作为特征样本,但由于算法实现的问题,有一定概率截取到黑色框这样的样本,这样对最终的训练结果会有影响

    不知道这样描述是否理解了
  • ipwx4月前
    引用9
    @AlwaysBee 不理解。

    “前面说的波动大,就是如图红框中间的波形图波动陡峭起伏大的意思”

    你这描述,每个人都有每个人不同的看法啊。你还是得形式化啊

    ----
    我用 t 表示时间,y1 y2 y3 表示序列。

    如果认为 y1 在 t 时刻起伏大,是绝对值大?

    abs(y1[t]) 很大?

    什么叫大?比 80% 的其他点大?

    ----

    如果时刻 t 只有一条线的绝对值大,那算不算你 t 时刻这三条线大?

    还是需要三条线都起伏大?
    ----


    如果 t 时刻,三条线的绝对值都不算很大,但是加起来比其他时刻绝对值加起来大,那算不算?
    ----

    我感觉你这个根本不是机器学习的范畴,只是你自己没有把问题描述清楚。你写清楚了就写出来了。
  • AlwaysBee楼主4月前
    引用10
    @ipwx #8
    其实问题简化一下就是:如何截取到红色框框这这种类型的数据样本(两边平缓、中间起伏大)

    波动大小的判断就是这个问题的关键,怎么判断也是我想问的,我不知道如何通过数学的方式去判断(只能通过波形图判断这个波动大)

    特征数据提取之后,是需要把特征数据扔进去训练模型的,算是数据预处理的步骤
  • ipwx4月前
    引用11
    @AlwaysBee

    1 、中间大两边小,我上面说了啊,加卷积啊。
    2 、但是加什么卷积、卷积核多宽、然后三个曲线是加起来还是求平均还是求最大值,你得把问题描述清楚才能具体啊。
  • ipwx4月前
    引用12
    你要不给个 csv 数据,我给你 python 随便写一段。你就能体会为啥我上面要问你那么依托东西了。
  • AlwaysBee楼主4月前
    引用13
    https://docs.qq.com/sheet/DY1VPTWRXbXdoUXdx
    你看看能否打开,腾讯文档
    @ipwx #11
  • SiWXie4月前
    引用14
    你这和建模没太大关系,是数据预处理的范涛。我建议是可以使用傅里叶变换,从时域信号变为频域信号,进行频域分析,抹点你不想要的波形后,再转换回来进行提取
  • 回复请 登录 or 快速注册
返回