代做COMP9414 24T2 Artificial Intelligence Assignment 1 - Artificial neural networks代做留学生Python程序

COMP9414 24T2

Artificial Intelligence

Assignment 1 - Artificial neural networks

Due: Week 5, Wednesday, 26 June 2024, 11:55 PM.

1 Problem context

Time Series Air Quality Prediction with Neural Networks: In this assignment, you will delve into the realm of time series prediction using neural network architectures.  You will explore both classification and estimation tasks using a publicly available dataset.

You will be provided with a dataset named Air Quality,” [1] available on the UCI Machine Learning Repository. We tailored this dataset for this assignment and made some modifications. Therefore,  please only use the attached dataset for this assignment.

The given dataset contains 8,358 instances of hourly averaged responses from an array of five metal oxide chemical sensors embedded in an air qual- ity chemical multisensor device.   The device was located in the field in  a significantly polluted area at road level within an Italian city.  Data were recorded from March 2004 to February 2005  (one  year),  representing the longest freely available recordings of on-field deployed air quality chemical sensor device responses. Ground truth hourly averaged concentrations for carbon monoxide, non-methane hydrocarbons, benzene, total nitrogen ox-ides,  and nitrogen dioxide among other variables were provided by a co-located reference-certified analyser.   The variables included in the dataset are listed in Table 1. Missing  values within the dataset are tagged with -200 value.

Table 1: Variables within the dataset.

Variable

Meaning

CO(GT)

True hourly averaged concentration of carbon monoxide

PT08.S1(CO)

Hourly averaged sensor response

NMHC(GT)

True hourly averaged overall Non Metanic HydroCar- bons concentration

C6H6(GT)

True hourly averaged Benzene concentration

PT08.S2(NMHC)

Hourly averaged sensor response

NOx(GT)

True hourly averaged NOx concentration

PT08.S3(NOx)

Hourly averaged sensor response

NO2(GT)

True hourly averaged NO2 concentration

PT08.S4(NO2)

Hourly averaged sensor response

PT08.S5(O3)

Hourly averaged sensor response

T

Temperature

RH

Relative Humidity

AH

Absolute Humidity

2 Activities

This assignment focuses on two main objectives:

•  Classification  Task:  You  should develop  a neural network that can predict whether the concentration of Carbon Monoxide (CO) exceeds a certain threshold – the mean of CO(GT) values – based on historical air quality data.  This task involves binary classification, where your model learns to classify instances into two categories:  above or below the threshold. To determine the threshold, you must first calculate the mean value for CO(GT), excluding unknown data (missing values). Then, use this threshold to predict whether the value predicted by your network is above or below it.  You are free to choose and design your own network, and there are no limitations on its structure.  However, your network should be capable of handling missing values.

•  Regression Task:  You should develop a neural network that can pre- dict the concentration of Nitrogen Oxides (NOx) based on other air quality features.  This task involves estimating a continuous numeri- cal value (NOx concentration) from the input features using regression techniques.  You are free to choose and design your own network and there is no limitation on that, however, your model should be able to deal with missing values.

In summary, the classification task aims to divide instances into two cat- egories (exceeding or not exceeding CO(GT) threshold), while the regression task aims to predict a continuous numerical value (NOx concentration).

2.1 Data preprocessing

It is expected you analyse the provided data and perform any required pre- processing.  Some of the tasks during preprocessing might include the ones shown below; however, not all of them are necessary and you should evaluate each of them against the results obtained.

(a) Identify variation range for input and output variables.

(b)  Plot each variable to observe the overall behaviour of the process.

(c)  In case outliers or missing data are detected correct the data accord- ingly.

(d)  Split the data for training and testing.

2.2 Design of the neural network

You should select and design neural architectures for addressing both the classification and regression problem described above. In each case, consider the following steps:

(a)  Design the network and decide the number of layers, units, and their respective activation functions.

(b)  Remember it’s recommended your network accomplish the maximal number of parameters Nw < (number of samples)/10.

(c)  Create the neural network using Keras and TensorFlow.

2.3 Training

In this section, you have to train your proposed neural network.  Consider the following steps:

(a)  Decide the training parameters such as loss function, optimizer, batch size, learning rate, and episodes.

(b)  Train the neural model and verify the loss values during the process.

(c) Verify possible overfitting problems.

2.4 Validating the neural model

Assess your results plotting training results and the network response for the test inputs against the test targets.  Compute error indexes to complement the visual analysis.

(a) For the classification task, draw two different plots to illustrate your results over different epochs.  In the first plot, show the training and validation loss over the epochs.  In the second plot, show the training and validation accuracy over the epochs.  For example, Figure 1 and Figure 2 show loss and classification accuracy plots for  100  epochs, respectively.

(b) For the classification task, compute a confusion matrix including True Positive (TP), True Negative (TN), False Positive (FP), and False Neg- ative (FN), as shown in Table 2. Moreover, report accuracy and pre- cision for your test data and mention the number of tested samples as shown in Table 3 (the numbers shown in both tables are randomly cho- sen and may not be consistent with each other). For instance, Sklearn library offers a various range of metric functions, including confusion matrix, accuracy, and precision.  You can use  Sklearn in-built met- ric functions to calculate the mentioned metrics or develop your own functions.

Table 2: Confusion matrix for the test data for the classification task.

Confusion Matrix

Positive (Actual)

Negative (Actual)

Positive (Predicted)

103

6

Negative (Predicted)

6

75

Table 3: Accuracy and precision for the test data for the classification task.

Accuracy

Precision

Number of Samples

CO(GT) classification

63%

60%

190

(c)  For the regression task, draw two different plots to illustrate your re- sults.  In the first plot, show how the selected loss function varies for both the training and validation through the epochs.  In the second plot, show the final estimation results for the validation test.  For in- stance, Figure 3 and Figure 4 show the loss function and the network outputs vs the actual NOx(GT) values for a validation test, respec- tively. In Figure 4 no data preprocessing has been performed, however, as mentioned above, it is expected you include this in your assignment.

(d)  For the regression task, report performance indexes including the Root Mean  Squared  Error  (RMSE),  Mean  Absolute  Error  (MAE)  (see  a discussion on  [2]), and the number of samples for your estimation of

NOx(GT) values in a table.  Root Mean Squared Error (RMSE) mea- sures the differences between the observed values and predicted ones and is defined as follows:

where n is the number of our samples, Yi  is the actual label and Y(ˆ)i

is the predicted value.  In the same way, MAE can be defined as the absolute average of errors as follows:

Table 4 shows an example of the performance indexes (all numbers are randomly chosen and may not be consistent with each other).  As men- tioned before, Sklearn library offers a various range of metric functions, including RMSE and MAE. You can use Sklearn in-built metric func- tions to calculate the mentioned metrics or develop your own functions.

Table 4: Result table for the test data for the regression task.

RMSE

MAE

Number of Samples

90.60

50.35

55

3    Testing and discussing your code

As part of the assignment evaluation, your code will be tested by tutors along with you in a discussion session carried out in the tutorial session in week 6. The assignment has a total of 25 marks.  The discussion is mandatory and, therefore, we will not mark any assignment not discussed with tutors.

You are expected to propose and build neural models for classification and regression tasks.  The minimal output we expect to see are the results mentioned above in Section 2.4. You will receive marks for each of these subsection as shown in Table 5, i.e.  7 marks in total.  However, it’s fine if you want to include any other outcome to highlight particular aspects when testing and discussing your code with your tutor.

For marking your results, you should be prepared to simulate your neural model with a generalisation set we have saved apart for that purpose.  You must anticipate this by including in your submission a script ready to open a file (with the same characteristics as the given dataset but with fewer data points), simulate the network, and perform all the validation tests described in Section 2.4 (b) and (d) (accuracy, precision, RMSE, MAE). It is recom- mended to save all of your hyper-parameters and weights  (your model in general) so you can call your network and perform the analysis later in your discussion session.

As for the classification task, you need to compute accuracy and precision, while for the regression task RMSE and MAE using the generalisation set. You will receive 3 marks for each task, given successful results.  Expected results should be as follows:

•  For the classification task, your network should achieve at least 85% accuracy and precision.  Accuracy and precision lower than that will result in a score of 0 marks for that specific section.

•  For the regression task, it is expected to achieve an RMSE of at most

280 and an MAE of 220 for unseen data points.  Errors higher than the mentioned values will be marked as 0 marks.

Finally, you will receive 1 mark for code readability for each task, and your tutor will also give you a maximum of 5 marks for each task depending on the level of code understanding as follows: 5. Outstanding, 4. Great, 3. Fair, 2. Low, 1. Deficient, 0. No answer.

Table 5: Marks for each task.

Task Marks

Results obtained with given dataset

Loss and accuracy plots for classification task                                                  2 marks

Confusion matrix and accuracy and precision tables for classifi-cation task          2 marks

Loss and estimated NOx(GT) plots for regression task                                      2 marks

Performance indexes table for regression task                                                 1 mark

Results obtained with generalisation dataset

Accuracy and precision for classification task                                                   3 marks

RMSE and MAE for regression task                                                                 3 marks

Code understanding and discussion

Code readability for classification task                                                             1 mark

Code readability for regression task                                                                1 mark

Code understanding and discussion for classification task                                  5 mark

Code understanding and discussion for regression task                                      5 mark

Total marks                                                                                                   25 marks

4 Submitting your assignment

The assignment must be done individually. You must submit your assignment solution by Moodle. This will consist of a single .ipynb Jupyter file. This file should contain all the necessary code for reading files, data preprocessing, network architecture, and result evaluations. Additionally, your file should include short text descriptions to help markers better understand your code. Please be mindful that providing clean and easy-to-read code is a part of your assignment.

Please indicate your full name and your zID at the top of the file as a comment. You can submit as many times as you like before the deadline – later submissions overwrite earlier ones. After submitting your file a good practice is to take a screenshot of it for future reference.

Late submission penalty: UNSW has a standard late submission penalty of 5% per day from your mark, capped at five days from the as- sessment deadline, after that students cannot submit the assignment.

5 Deadline and questions

Deadline: Week  5,  Wednesday  26  June  of  June  2024,  11:55pm. Please use the forum on Moodle to ask questions related to the project. We will prioritise questions asked in the forum. However, you should not share your code to avoid making it public and possible plagiarism. If that’s the case, use the course email cs9414@cse .unsw .edu .au as alternative.

Although we try to answer questions as quickly as possible, we might take up to 1 or 2 business days to reply, therefore, last-moment questions might not be answered timely.




热门主题

课程名

mktg2509 csci 2600 38170 lng302 csse3010 phas3226 77938 arch1162 engn4536/engn6536 acx5903 comp151101 phl245 cse12 comp9312 stat3016/6016 phas0038 comp2140 6qqmb312 xjco3011 rest0005 ematm0051 5qqmn219 lubs5062m eee8155 cege0100 eap033 artd1109 mat246 etc3430 ecmm462 mis102 inft6800 ddes9903 comp6521 comp9517 comp3331/9331 comp4337 comp6008 comp9414 bu.231.790.81 man00150m csb352h math1041 eengm4100 isys1002 08 6057cem mktg3504 mthm036 mtrx1701 mth3241 eeee3086 cmp-7038b cmp-7000a ints4010 econ2151 infs5710 fins5516 fin3309 fins5510 gsoe9340 math2007 math2036 soee5010 mark3088 infs3605 elec9714 comp2271 ma214 comp2211 infs3604 600426 sit254 acct3091 bbt405 msin0116 com107/com113 mark5826 sit120 comp9021 eco2101 eeen40700 cs253 ece3114 ecmm447 chns3000 math377 itd102 comp9444 comp(2041|9044) econ0060 econ7230 mgt001371 ecs-323 cs6250 mgdi60012 mdia2012 comm221001 comm5000 ma1008 engl642 econ241 com333 math367 mis201 nbs-7041x meek16104 econ2003 comm1190 mbas902 comp-1027 dpst1091 comp7315 eppd1033 m06 ee3025 msci231 bb113/bbs1063 fc709 comp3425 comp9417 econ42915 cb9101 math1102e chme0017 fc307 mkt60104 5522usst litr1-uc6201.200 ee1102 cosc2803 math39512 omp9727 int2067/int5051 bsb151 mgt253 fc021 babs2202 mis2002s phya21 18-213 cege0012 mdia1002 math38032 mech5125 07 cisc102 mgx3110 cs240 11175 fin3020s eco3420 ictten622 comp9727 cpt111 de114102d mgm320h5s bafi1019 math21112 efim20036 mn-3503 fins5568 110.807 bcpm000028 info6030 bma0092 bcpm0054 math20212 ce335 cs365 cenv6141 ftec5580 math2010 ec3450 comm1170 ecmt1010 csci-ua.0480-003 econ12-200 ib3960 ectb60h3f cs247—assignment tk3163 ics3u ib3j80 comp20008 comp9334 eppd1063 acct2343 cct109 isys1055/3412 math350-real math2014 eec180 stat141b econ2101 msinm014/msing014/msing014b fit2004 comp643 bu1002 cm2030
联系我们
EMail: 99515681@qq.com
QQ: 99515681
留学生作业帮-留学生的知心伴侣!
工作时间:08:00-21:00
python代写
微信客服:codinghelp
站长地图