代做Smart Industry Operations 2024-2025代写留学生Matlab语言

Smart Industry Operations 2024-2025

Individual (Repair) Assignment

Bias in healthcare operations

Context of the Assignment

Diagnosing severe schizophrenia is important for individuals, families, and healthcare systems. It allows to address the condition effectively and improve outcomes. There is evidence that clinicians may overemphasise psychotic symptoms or underemphasise depressive systems in black African Americans  in the  US.  This  can  be  attributed  to  diagnostic  bias.  Misdiagnosis  may  have  harmful effects, leading to healthcare provision disparities.

The context of this assignment is to study the extent to which a correct categorisation of diagnostic cases between schizophrenia and depression cases can be achieved based on a range of potential diagnostic  attributes.  Additionally,  of  further  interest  is  to  identify  weather  there  might  be diagnostic  disparities  between  sensitive  characteristics,  such  as  gender  (sex)  and  race.  Such diagnostic  disparities  may  have  implications  for  disparities  in  healthcare  provisions,  resulting  in healthcare services inequalities. Diagnostic disparities may mask how sensitive attributes intersect with other important factors, such as family expenditure on healthcare for example.  If bias exists already within electronic patient records, this may eventually be amplified when machine learning models are operationalised despite being agnostic of the presence of such disparities.

In the  considered  case,  a  machine  learning  model  may  be  considered  by  a  healthcare  provider eager to  increase  efficiency  to  be  sufficiently  accurate  for  operationalisation  if  overall  accuracy exceeds  90%.  Your task  is  to  analyse  the  case  data,  build  machine  learning  models,  and  make concrete  recommendations  based  on  evidence  obtained  from  your  experience  with  respect  to operationalising the use of your machine learning models.

Case Data

We  consider  gender  and   race  as  two  sensitive  features  in  a  dataset  that  contains  electronic healthcare data of people who have been diagnoses with a condition, but it is uncertain whether the diagnosis should be schizophrenia or depression.

The dataset contains records with the following attributes:

Diagnosis : affective disorder (0) or schizophrenia (1). This is the output attribute. The rest are input attributes and include:

Sensitive features :

Sex: takes value Male or Female

Race: takes values Asian, Hispanic, Black, White Psychosocial features:

Delay: denoting delay in seeking care (takes values Yes/No)

Housing: takes values Stable or Unstable, denoting the housing status of the individual

In the  attributes  below,  a  clinician  may  be  from  different  disciplines  or  may  refer  to  rating  by different types of clinicians; for simplicity here a single type of clinician is mentioned.

Anhedonia: clinical assessment  indicating inability to  experience enjoyment  in activities typically perceived as enjoyable or fulfilling; rated by a clinician.

Dep_Mood:  clinical  assessment  indicating  persistent  state  of  sadness,  low  energy,  or  emotional heaviness; rated by a clinician.

Sleep: average hours of sleep per day; rated by the patient.

Tired: whether the patient feels tired or not; rated by the patient.

Appetite: the extent to which the patient has good appetite; rated by the patient.

Rumination: the extent to which the patient is trapped in same thoughts; rated by a clinician. Concentration: the ability of a patient to concentrate; rated by a clinician.

Psychomotor:   the   extent   to   which   abnormalities    in   how   a    patient’s   movement   follow   a thought/mental process; assessed via standardised tests via a clinician.

Delusion: the extent to which false beliefs feature in a patient’s thinking; rated by a clinician.

Suspicious: the extent to which a patient is unreasonably over-suspicious and distrusts others; rated by a clinician.

Withdrawal: the extent to which a patient is in a state of disengagement with social interaction and activities; rated by a clinician.

Passive: the extent to which a patient feels a lack of control over own thoughts; rated by a clinician.

Tension: the extent to which a patient is in a state of unease, strain or agitation; feels a lack of control over own thoughts; rated by a clinician.

Unusual_Thought:  the  extent  to  which  a  patient  have  thoughts,   beliefs  or   perceptions  that significantly deviate from what is typically expected in a given social or cultural context; rated by a clinician.

The provided datasets are:

A. diagnosis_train.csv

A  populated  with  all  above   information.  You  will   use  this  for  your  analysis  and  for   training classification models.

B. diagnosis_predict.csv

This is a similar dataset to A, but on this one you have no access to the outcome. You will use this to classify unknown cases to schizophrenia or depression.

Assignment Questions

A.1. Exploratory Data Analysis (15% of Repair Assignment mark)

In this part you are expected to:

A1.1. Explore the variables, their types, and their basic statistics.

A1.2. Analyse further the data regarding data distributions, range of values, existence of outliers and correlations between attributes, as well as between input attributes and Diagnosis. Which are your  observations? Additionally, to what  extent  is  the  dataset  balanced  regarding  the  different categories  of  the   sex  and   race   sensitive  attributes?  To  what   extent   is  the   dataset  balanced regarding the diagnosis per different categories of the sex and race sensitive attributes?

A.2. Classification (40% of Repair Assignment mark)

In this part you are expected to develop classifier models. You will have to consider how best to use your training data (diagnosis_train.csv) and you are asked to apply the developed models to the “diagnosis_predict.csv” data at the end and produce diagnosis predictions for them.

A2.1. Apply a decision tree classifier, choosing different hyperparameters (as a minimum, different tree depths) on the diagnosis_train.csv. Motivate your solution analysis in relation to overfit and generalization. Report and analyse performance using different performance metrics. Analyse your findings. Do you observe any difference on performance for different sensitive attributes categories (e.g. sex, race)? Finally, choose a developed model and apply it to the diagnosis_predict.csv data to produce your diagnosis predictions.

A2.2. Apply a random forest classifier, choosing different hyperparameters (as a minimum, different number of estimators and tree depths). Motivate your solution and analysis in relation to overfit and generalization. Report and analyse performance using different performance metrics. Analyse your  findings.  Do  you  observe  any  difference  on  performance  for  different  sensitive  attributes categories    (e.g.    sex,    race)?    Finally,    choose    a    developed    model    and    apply    it    to    the diagnosis_predict.csv data to produce your predictions.

A2.3. Make a comparative analysis across all classifier experiments. Make a reasoned choice of a classifier to select and motivate the choice referring to the evidence obtained from performance metrics.

A.3. Bias Analysis and Management (35% of Repair Assignment mark)

In this part you are expected to further analyse the data and the results you obtained  regarding potential bias. Specifically, answer the following questions:

A3.1. Consider your results above. For which combination of sensitive attributes (sex, race) did you observe the largest diagnostic disparity (meaning largest difference between precision and recall)? And for which combination did you observe the smallest diagnostic disparity?

A3.2. Now choose the combination with the largest diagnostic disparity. Out of your training data, retain only the data corresponding to this combination of sensitive attributes. Build the same type of  model as in A2.1 and A2.2 using only these data and perform similar analysis as in A2.1 and A2.2Which are your observations and how you interpret your results?

A3.3. Apply resampling of the data records for the selected combination of sensitive attributes to balance precision and recall. Perform the same machine learning as in A3.2.  Report and analyse results. Which are the observed differences with respect to diagnostic disparity?

A3.4. Without applying resampling, can you think and apply an alternative method to improve the diagnostic disparity?

A.4. Overall comparisons and analysis  (10% of Repair Assignment mark)

In this part you are expected to:

Discuss  comparatively  the  obtained  results  highlight  only  what  you  see  as  most  interesting regarding the obtained performance and/or aspects of data  unbalance, and fairness,  motivating your   analysis   on   the    basis   of   the    obtained   evidence.    What   would    be   your    concluding recommendations?.

Further Instructions

In this assignment you will address the questions provided. The assignment is delivered as a Jupyter Notebook. Jupyter Notebooks do not have pre-specified length. However a good Notebook should be at the same time sufficiently explanatory and  relatively  compact.  It  should  include  insightful motivation, analysis and interpretations, grounded on evidence from the data, the processing of the data you performed, and results you have obtained.

You should submit this assignment via email to:

[email protected]

You  should  receive  receipt  confirmation  within  24  hours  -  if  not  this  might  indicate  that  your assignment was not received, in which case please submit again or enquire about it.

Submission deadline: 29 January 23:59


热门主题

课程名

mktg2509 csci 2600 38170 lng302 csse3010 phas3226 77938 arch1162 engn4536/engn6536 acx5903 comp151101 phl245 cse12 comp9312 stat3016/6016 phas0038 comp2140 6qqmb312 xjco3011 rest0005 ematm0051 5qqmn219 lubs5062m eee8155 cege0100 eap033 artd1109 mat246 etc3430 ecmm462 mis102 inft6800 ddes9903 comp6521 comp9517 comp3331/9331 comp4337 comp6008 comp9414 bu.231.790.81 man00150m csb352h math1041 eengm4100 isys1002 08 6057cem mktg3504 mthm036 mtrx1701 mth3241 eeee3086 cmp-7038b cmp-7000a ints4010 econ2151 infs5710 fins5516 fin3309 fins5510 gsoe9340 math2007 math2036 soee5010 mark3088 infs3605 elec9714 comp2271 ma214 comp2211 infs3604 600426 sit254 acct3091 bbt405 msin0116 com107/com113 mark5826 sit120 comp9021 eco2101 eeen40700 cs253 ece3114 ecmm447 chns3000 math377 itd102 comp9444 comp(2041|9044) econ0060 econ7230 mgt001371 ecs-323 cs6250 mgdi60012 mdia2012 comm221001 comm5000 ma1008 engl642 econ241 com333 math367 mis201 nbs-7041x meek16104 econ2003 comm1190 mbas902 comp-1027 dpst1091 comp7315 eppd1033 m06 ee3025 msci231 bb113/bbs1063 fc709 comp3425 comp9417 econ42915 cb9101 math1102e chme0017 fc307 mkt60104 5522usst litr1-uc6201.200 ee1102 cosc2803 math39512 omp9727 int2067/int5051 bsb151 mgt253 fc021 babs2202 mis2002s phya21 18-213 cege0012 mdia1002 math38032 mech5125 07 cisc102 mgx3110 cs240 11175 fin3020s eco3420 ictten622 comp9727 cpt111 de114102d mgm320h5s bafi1019 math21112 efim20036 mn-3503 fins5568 110.807 bcpm000028 info6030 bma0092 bcpm0054 math20212 ce335 cs365 cenv6141 ftec5580 math2010 ec3450 comm1170 ecmt1010 csci-ua.0480-003 econ12-200 ib3960 ectb60h3f cs247—assignment tk3163 ics3u ib3j80 comp20008 comp9334 eppd1063 acct2343 cct109 isys1055/3412 math350-real math2014 eec180 stat141b econ2101 msinm014/msing014/msing014b fit2004 comp643 bu1002 cm2030
联系我们
EMail: 99515681@qq.com
QQ: 99515681
留学生作业帮-留学生的知心伴侣!
工作时间:08:00-21:00
python代写
微信客服:codinghelp
站长地图