装载自:https://www.debugger.wiki/article/html/1577444402436939
handlebarsimport numpy as np import pandas as pd def detect_outliers(data, threshold=3): """离群点检测""" mean_d = np.mean(data) std_d = np.std(data) outliers = [] for y in data: z_score = (y - mean_d) / std_d if np.abs(z_score) > threshold: outliers.append(y) return outliers
handlebarsdef detect_outliers(sr): q1 = sr.quantile(0.25) q3 = sr.quantile(0.75) iqr = q3-q1 #Interquartile range fence_low = q1-1.5*iqr fence_high = q3+1.5*iqr outliers = sr.loc[(sr < fence_low) | (sr > fence_high)] return outliers
本文作者:Dong
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!