<div dir="ltr"><font face="arial, helvetica, sans-serif" color="#000000" style="font-size:12.8px">Hello mentors and developers,</font><div style="font-size:12.8px"><font face="arial, helvetica, sans-serif" color="#000000"><br></font></div><div style="font-size:12.8px"><div><font face="arial, helvetica, sans-serif" color="#000000">I'm Rohan Saxena, an undergraduate sophomore studying Computer Science at BITS Pilani, India (one of the top 3 engineering schools in the country and the best private engineering college in India). I'm extremely interested in machine learning and deep learning, and wish to contribute to JdeRobot by implementing the<a href="http://jderobot.org/Collaborate#Project_.238:_Deep_Learning_to_detect_objects_at_images_from_RGBD_sensors" target="_blank"> deep learning project</a> mentioned on the ideas page.</font></div><div><font color="#000000" face="arial, helvetica, sans-serif"><br></font></div><div><font face="arial, helvetica, sans-serif" color="#000000">Here I have been a member of the Embedded Systems and Robotics lab since my freshman year itself. I work on robotics and artificial intelligence (specifically computer vision and deep learning).</font></div><div><font face="arial, helvetica, sans-serif" color="#000000"><br></font></div><div><font face="arial, helvetica, sans-serif" color="#000000">I am also a student at the Udacity self-driving car nanodegree, and as part of the programme I have implemented various deep learning architectures (especially CNNs) with established personnel in machine learning (PhDs, scientists, professionals, etc). This has enabled me to develop a</font><span style="color:rgb(0,0,0);font-family:arial,helvetica,sans-serif"> solid understanding of the math behind ML algorithms like convolutions, for instance.</span><font face="arial, helvetica, sans-serif" color="#000000"><br></font></div><div><br></div><div>For this project, I plan to employ the techniques mentioned in <a href="https://arxiv.org/pdf/1507.06821.pdf" target="_blank">this paper</a> to use CNNs in RGBD object recognition. I am fluent in implementing computer vision algorithms in C++ in TensorFlow.</div><div><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px"><br></span></div><div><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px">I want to provide an architecture which can be directly deployed on a local machine with pre-trained parameters (if the user wants), with options for further training and optimisation and/or editing the architecture itself. </span><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px">A user will be able to treat the architecture as a black box and load it to train/test it as he/she desires. </span><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px">This will allow the user to load pre-trained parameters trained on the standard dataset and train/test it on a dataset of their choice.</span></div><div><div style="margin:0px;padding:0px;border:0px;font-size:12.8px"><span style="margin:0px;padding:0px;border:0px;font-family:arial,helvetica,sans-serif"><br></span></div><div style="margin:0px;padding:0px;border:0px;font-size:12.8px"><font face="arial, helvetica, sans-serif" style="margin:0px;padding:0px;border:0px">Since the source code of the models will be available to the user, they can also edit the existing model and tweak the hyperparameters, or the architecture itself (add/edit layers, for instance), to try to increase performance. They can then use this modified architecture as they wish.</font></div></div><div><br></div><div>Kindly let me know your views.</div></div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Sincerely,</div><div style="font-size:12.8px">Rohan Saxena</div><div style="font-size:12.8px">CS Sophomore</div><div style="font-size:12.8px">BITS Pilani, Pilani campus</div><div style="font-size:12.8px">Rajasthan, India</div><img width="0" height="0" class="mailtrack-img" src="https://mailtrack.io/trace/mail/a50ac6aeee7ab35b82b4e75f7ff7de4a285812c8.png?u=1359560"></div>