Cách Tính Hiệp Phương Sai

  -  
Giới thiệu

Làm vấn đề cùng với những trở thành vào phân tích dữ liệu luôn luôn đưa ra câu hỏi: Các trở thành phụ thuộc, link với biến đổi cùng nhau như thế nào? Các biện pháp hiệp pmùi hương không nên với thông số tương quan đường tính góp tùy chỉnh điều này.

Bạn đang xem: Cách tính hiệp phương sai

Hiệp phương thơm không đúng đưa về sự đổi khác giữa các vươn lên là. Chúng ta sử dụng hiệp phương thơm không đúng nhằm đo lường và thống kê cường độ nhị thay đổi thay đổi cùng nhau.Hệ số đối sánh tương quan đường tính tiết lộ quan hệ thân các phát triển thành. Chúng ta sử dụng côn trùng tương quan nhằm khẳng định mức độ liên kết ngặt nghèo của nhì biến đổi với nhau.

Pmùi hương sai với Tương quan - Nói một bí quyết 1-1 giản

Cả hiệp pmùi hương sai và đối sánh là nhị định nghĩa trong lĩnh vực Phần Trăm thống kê lại, những nói đến quan hệ giữa những trở nên. Hiệp pmùi hương không đúng xác định mọt liên kết được đặt theo hướng thân những trở thành. Giá trị hiệp phương thơm không đúng nằm trong vòng từ−∞ đến +∞ trong số ấy quý giá dương biểu hiện rằng cả nhị trở thành chuyển động theo cùng 1 phía với quý giá âm bộc lộ rằng cả nhị thay đổi vận động trái chiều nhau.

Tương quan là 1 trong thước đo thống kê được tiêu chuẩn chỉnh hóa thể hiện cường độ nhưng nhị biến đổi bao gồm tương quan con đường tính với nhau (tức là chúng chuyển đổi bên nhau cùng với tốc độ ko đổi bao nhiêu). Độ bạo gan cùng sự phối kết hợp kim chỉ nan của mối quan hệ giữa hai trở nên được khẳng định theo mọt tương quan với nó nằm trong khoảng trường đoản cú -1 mang đến +1. Tương từ bỏ như hiệp phương thơm không nên, quý hiếm dương biểu lộ rằng cả nhì biến đổi vận động theo thuộc 1 phía trong khi quý giá âm mang đến chúng ta hiểu được bọn chúng di chuyển theo những hướng ngược nhau.

Cả hiệp phương thơm sai và tương quan phần đa là gần như phương tiện đặc trưng được sử dụng vào bài toán dò xét dữ liệu để lựa chọn đối tượng người dùng địa lý cùng so với đa đổi mới.lấy ví dụ, một đơn vị chi tiêu đã tìm kiếm bí quyết phân tán rủi ro khủng hoảng của danh mục đầu tư rất có thể search kiếm những cổ phiếu có hiệp phương thơm sai cao, vày điều này cho biết giá bán của chúng tăng và một thời điểm. Tuy nhiên, chỉ riêng rẽ một hoạt động tương tự là không đủ.Sau kia, công ty đầu tư chi tiêu đang áp dụng số liệu đối sánh tương quan nhằm xác minh cường độ links chặt chẽ giữa các giá cổ phiếu kia với nhau.

Xem thêm: Phim Lẻ Võ Thuật Lý Liên Kiệt Cận Vệ Trung Nam Hải, Phim Lẻ Võ Thuật Lý Liên Kiệt,

Thiết lập cho code Pykhông lớn - Truy xuất dữ liệu mẫu

Hãy xem tập dữ liệu, bên trên kia Cửa Hàng chúng tôi đã tiến hành phân tích:

*
bọn họ chọn hai cột nhằm so sánh - sepal_length với sepal_width.Trong một tệp Pyhẹp new (có thể đặt tên nó là covariance_correlation.py), hãy ban đầu bằng cách tạo thành hai danh sách với các quý giá mang lại trực thuộc tính sepal_length và sepal_width của flower:

with open("iris_setosa.csv","r") as f: g=f.readlines() # Each line is split based on commas, & the danh sách of floats are formed sep_length = ) for x in g<1:>> sep_width = ) for x in g<1:>>Trong kỹ thuật dữ liệu, nó luôn góp trực quan liêu hóa dữ liệu ai đang thao tác làm việc. Đây là biểu thứ hồi quy Seaborn (Biểu vật dụng phân tán + phù hợp hồi quy con đường tính) của những nằm trong tính setosa này bên trên các trục khác nhau:

*
Về khía cạnh trực quan, những điểm dữ liệu giống như bao gồm mối đối sánh tương quan cao gần với mặt đường hồi quy. Hãy xem liệu các quan lại cạnh bên của họ có khớp cùng với các cực hiếm hiệp phương không đúng và tương quan của bọn chúng hay không.

Tính toán thù hiệp phương không nên trong Python

Công thức dưới đây tính hiệp pmùi hương sai:

*
Trong công thức trên,

xi, yi - are individual elements of the x & y seriesx̄, y̅ - are the mathematical means of the x & y seriesN - is the number of elements in the series

Mẫu số là N so với toàn thể tập dữ liệu và N - 1 đối với mẫu mã. Vì tập dữ liệu của họ là 1 trong chủng loại bé dại của toàn thể tập dữ liệu Iris bắt buộc chúng ta áp dụng N - 1.

def covariance(x, y): # Finding the mean of the series x and y mean_x = sum(x)/float(len(x)) mean_y = sum(y)/float(len(y)) # Subtracting mean from the individual elements sub_x = sub_y = numerator = sum(*sub_y for i in range(len(sub_x))>) denominator = len(x)-1 cov = numerator/denominator return covwith open("iris_setosa.csv", "r") as f: ... cov_func = covariance(sep_length, sep_width) print("Covariance from the custom function:", cov_func)Đầu tiên chúng ta search các quý hiếm vừa đủ của cục dữ liệu. Sau kia, bọn họ thực hiện năng lực đọc danh sách để tái diễn số đông thành phần trong nhị chuỗi dữ liệu của chúng ta và trừ cực hiếm của chúng mang đến giá trị mức độ vừa phải.

Xem thêm: Game Boi Tinh Yeu Online - Tuyệt Chiêu Xem Bói Bài Tình Yêu Chính Xác 100%

Sau đó, bọn họ thực hiện những giá trị trung gian kia của hai chuỗi "với nhân chúng với nhau trong một giải pháp đọc danh sách không giống. Chúng ta tính tổng kết quả của list kia với tàng trữ nó bên dưới dạng tử số. Mẫu số thuận tiện rộng không hề ít để tính toán thù, hãy lưu giữ tách nó đi 1 khi chúng ta sẽ search hiệp phương thơm không nên mang lại dữ liệu mẫu!

Sau kia, chúng ta trả về cực hiếm khi tử số được phân chia cho mẫu mã số của chính nó, vấn đề này dẫn mang lại hiệp phương thơm không nên.Ta được kết quả

Tính toán thù hệ số đối sánh trong Python

Để diễn tả mối quan hệ thân 2 vươn lên là là “mạnh” tốt “yếu”, bọn họ thực hiện correlation vậy cho covariance.

*

xi, yi - are individual elements of the x và y seriesThe numerator corresponds khổng lồ the covarianceThe denominators correspond to lớn the individual standard deviations of x & y

def correlation(x, y): # Finding the mean of the series x & y mean_x = sum(x)/float(len(x)) mean_y = sum(y)/float(len(y)) # Subtracting mean from the individual elements sub_x = sub_y = # covariance for x and y numerator = sum(*sub_y for i in range(len(sub_x))>) # Standard Deviation of x & y std_deviation_x = sum(**2.0 for i in range(len(sub_x))>) std_deviation_y = sum(**2.0 for i in range(len(sub_y))>) # squaring by 0.5 lớn find the square root denominator = (std_deviation_x*std_deviation_y)**0.5 # short but equivalent khổng lồ (std_deviation_x**0.5) * (std_deviation_y**0.5) cor = numerator/denominator return corwith open("iris_setosa.csv", "r") as f: ... cor_func = correlation(sep_length, sep_width) print("Correlation from the custom function:", cor_func)Vì quý hiếm này bắt buộc hiệp phương thơm không đúng của nhì thay đổi nên hàm không hề ít lần tính ra quý giá kia. Lúc hiệp phương không đúng được tính, họ tính độ lệch chuẩn chỉnh cho mỗi biến hóa. Từ kia, mối tương quan chỉ đơn giản dễ dàng là phân tách hiệp pmùi hương không nên với phxay nhân các bình pmùi hương của độ lệch chuẩn chỉnh.Chạy mã này, bọn họ cảm nhận kết quả sau, xác nhận rằng những trực thuộc tính này còn có quan hệ dương (vết của quý hiếm, hoặc +, - hoặc none ví như 0) và dạn dĩ (giá trị ngay sát bởi 1):