Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Petra Petrovics PhD Student Statistical Dependence
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Statistical Dependence Definition: Statistical dependence exists when the value of some variable is dependent upon or affected by the value of some other variable. Statistical Dependence Independent Functional variables relation
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Types of dependence association – between two nominal data –Yule (Y) –Csuprov (T) mixed – between a nominal and a ratio data –H; H 2 correlation – among ratio data
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet I. Association Where:f 11, f 10, f 01, f 00 the observed frequencies f 1., f 0., f.1, f.0 the marginal frequencies Y = 0the variables are independent 0 Y 1statistical dependence Y = 1functional relation A (1)B (0)Total X (1)f 11 f 10 f1.f1. Y (0)f 01 f 00 f0.f0. Totalf.1f.1 f.0f.0 n a) Yule-measure Only when the number of categories of both variables is two!
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet In case of statistical dependence: If the variables are independent:
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Example: Suppose that a certain elective is offered to freshmen and sophomores on a pass-fail basis only. An advisor is interested in determining whether there is a relationship between the student’s grade and class standings. Data for the test were obtained from last semester’s classes: Grade Class standings Freshman (1)Sophomore (0)Total Pass (1)81220 Fail (0) Total Medium-strong dependence
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet b) Contingency table there are s categories of the row/column variable: A 1, A 2, …, A s there are t categories of the row/column variable: B 1, B 2, …, B t where s < t j i B1B1 B2B2...BjBj BtBt A1A1 f 11 f 12...f 1j...f 1t f 1. A2A2 f 21 f 22...f 2j...f 2t f AiAi f i1 f i2...f ij...f it f i.... AsAs f s1 f s2...f sj...f st f s. f.1 f.2...f.j...f.t n
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet The measure for statistical dependence in case of contingency table T – measure,when s = t C – measure, when s < t 0 C 0,3 weak dependence 0,3 C 0,7 medium-strong dependence 0,7 C 1 strong dependence
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet The variables are independent, when…
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Example A manufacturer of printed circuit boards has determined that boards classified as nonconforming nearly always have one of three defects: a component on the board is either missing, damaged or raised (installed improperly). The boards are produced on three machines (A, B and C). To determine whether there is a relationship between the type of nonconformity and the machine, a sample of 500 nonconforming boards was obtained:
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Question: Is the type of nonconformity related to the machine used for production? Machine Type of nonconformity Total missingdamagedraised A B C Total s=3 t=3 T-measure
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Type of nonconformity and machine Missing, A Missing, B Missing, C Damaged, A Damaged, B Damaged, C Raised, A Raised, B Raised, C Total 2 = Solution Medium-strong dependence
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mixed dependence Analysis of Variance One-way analysis of variance is a technique used to compare means of two or more samples. In case of a qualitative and a quantitative variable.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Differences - variances d ji total difference: difference between an employee’s production and the grand mean B ji within-column difference: difference between an employee’s production and his group’s mean K ji between-column difference: difference between the group’s mean and the grand mean
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet d ji = B ji + K j SS = SS B + SS K 2 = 2 B + 2 K
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Measures of mixed dependence or Where: H = H 2 = 0the variables are independent H = H 2 = 1functional relation 0 H 1 0 H 0,3 weak dependence 0,3 H 0,7 medium-strong dependence 0,7 H 1 strong dependence 0 H 2 1 Statistical dependence
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Example Marks I.II.III. Total Faculty Excellent (5) Good (4) Medium (3) Satisfactory(2) Fail (1) Total Is there any dependence between the average marks and faculties?
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Facultiesn Faculty I Faculty II Faculty III Total or
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 1 The workers of a company are grouped according to their position and sex: Is there a relationship between position and sex? ManWomanTotal White-collar worker Blue-collar worker Total
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 2 In a town doctors are grouped in the following way: Find the type of statistical dependence and determine the strength of the relationship. ManWomanTotal Internist Gynecologist Optometrist73542 Others ,582 Total1, ,949
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 3 Calculate H and H 2 -measures. Number of passengers (million) Distance of the trip (km) MeanStandard deviation Bus Train Private bus Total524……
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 4 In a supermarket there was a survey among those who buy chips. 33 of the 100 persons who were asked bought Chio chips, one quarter of them bought Pom Bär, one tenth of them bought Lay’s. They spent 104 HUF on the average on chips. They spent 98 HUF on Chio chips and 74 HUF on Cerbona on the average. The 20 persons who bought Chee-tos all chose the same chips on sale which cost 120 HUF. The standard deviation of the money spent on Chio is 23 HUF, spent on Pom-Bär is 30 HUF, spent on Lay’s is 8 HUF, i.e % and in case of Cerbona it’s 14.86%. Create a table using these data and fill in the gaps. Determine the strength of relationship between the type of the chips and the money spent on them.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 5 In a shoe-factory the relationship between the sex and the education of the 2,500 employees was examined. 60% of the workers is man, 16% of the men has university degree and 24% of them has primary qualification. Half of those who has primary education is man, for those who has secondary education the principle of indipendence is realized. Fill in the following table and determine the relationship between sex and qualification! Education SexTotal ManWoman Primary Secondary University Total
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 6 The following table shows the distribution of workers in a company: What can you say about the strength of the relationship between sex and position? MenWomenTotal Managers4,1107,54511,655 Workers1, ,039 Total5,6868,00813,694
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Exercise 7 The tourists of hotels in 1996 were groupped in the following way: Is the type of tourists related to the type of hotels? Type of hotel Tourists Five and four ThreeTwo and one Total stars hotels Hungarian ,161 Foreign ,177 Total8461,3971,0953,338
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Thanks for your attention!