Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy
Học máy là một lĩnh vực của Trí tuệ nhân tạo liên quan đến việc phát triển các
kỹ thuật cho phép máy tính có thể thực hiện được các bài toán phức tạp. Cốt lõi của
học máy là phân tích các tập dữ liệu để tìm ra những quy luật và mô hình thích hợp
nhất để vận dụng vào thực tiễn. Những nghiên cứu trong lĩnh vực học máy đang
hướng đến tất cả lĩnh vực khác nhau trong cuộc sống như tin sinh học, y học, thị giác
máy tính [14], xử lý ngôn ngữ tự nhiên [19] và Trí tuệ nhân tạo [54] để cung cấp cho
người dùng các công cụ xử lý thông tin và hỗ trợ ra quyết định [62].
Ngày nay, khoa học và công nghệ phát triển đã tạo ra một khối lượng dữ liệu
lớn từ các hệ thống giao dịch điện tử, hệ thống lưu trữ dữ liệu đa phương tiện và các
ứng dụng của cảm biến trong internet vạn vật (internet of things). Sự phát triển công
nghệ đã thúc đẩy các nhà nghiên cứu chuyển từ thu, nhận dữ liệu ở mức thấp sang
nghiên cứu tích hợp mức cao có khả năng phân tích, nhận dạng và dự báo các vấn đề
có thể xảy ra trong tương lai [20]. Do đó, ngày càng nhiều bài toán thực tế cần được
giải quyết, đặc biệt là nhận dạng đối tượng chuyển động trong không gian để hỗ trợ
cho các hệ thống an ninh, ngôi nhà thông mình, bệnh viện thông minh, v.v. và cung
cấp cho người dùng những công cụ ngày càng hoàn thiện hơn.
Trong mô hình huấn luyện nhận dạng đối tượng chuyển động [45], dữ liệu đầu
vào được biểu diễn dưới dạng không gian vectơ đặc trưng và sử dụng các phương
pháp biểu diễn dữ liệu để trích chọn đặc trưng cho các mô hình học máy [14] phân
loại đối tượng. Hiện nay, có rất nhiều nghiên cứu liên quan đến biểu diễn đối tượng
trong học máy được các nhà khoa học đề xuất và thử nghiệm. Các nghiên cứu đã tập
trung vào phương pháp trích chọn đặc trưng giảm số chiều dữ liệu như phân tích
thành phần chính (Principal Components Analysis - PCA) [36], phân tích biệt thức
tuyến tính (Linear Discriminant Analysis - LDA) [42] và hồi quy thành phần chính
(Principal Component Regression - PCR) [35] và phương pháp tăng chiều dữ liệu
như máy vectơ hỗ trợ (kernel Support Vector Machine - SVM) [11, 90] và mạng2
nơron (Neural Network - NN) [8]. Tuy nhiên, các phương pháp này chủ yếu sử dụng
phương pháp tuyến tính và giả sử dữ liệu phân bố trên mặt phẳng hay siêu mặt phẳng
đặc biệt nào đó mà không phải dạng phân bố ngẫu nhiên trong không gian. Do đó,
quá trình biểu diễn các đối tượng chuyển động dựa vào học máy đã gặp rất nhiều khó
khăn:
- Thứ nhất, việc thu thập dữ liệu đầu vào từ nhiều nguồn, nhiều định dạng
khác nhau rất phức tạp, trong khi đó các phương pháp biểu diễn dữ liệu bị
giới hạn bởi các thuật toán đã có sẳn.
- Thứ hai, các đặc trưng của đối tượng thường rất lớn và không phải đặc
trưng nào cũng tốt cho các mô hình học máy.
- Thứ ba, các thuật toán phổ biến trong học máy thường sử dụng các phép
biến đổi tuyến tính và giả sử các đối tượng đều phân bố trên mặt phẳng hay
siêu phẳng. Điều này dẫn đến những khó khăn nhất định đối với dữ liệu
phân bố trên hình cầu hay siêu cầu, chẳng hạn như các đối tượng chuyển
động quay trong không gian nhiều chiều.
- Thứ tư, các hàm tối ưu trong học máy đa phần sử dụng hàm khoảng cách
Euclid nên không phản ánh được mối liên kết hình học và biểu diễn không
chính xác chuyển động của đối tượng. Ví dụ như, D. Gehrig [15] sử dụng
các phương pháp biệt thức tuyến tính (LDA) và chuyển tiếp tuần tự
(Sequential Forward Selection - SFS) để lựa chọn đặc trưng và giảm chi
phí tính toán. L. Fengjun [26] phân tích và đưa ra bảy loại đặc trưng khác
nhau dựa vào tư thế người và kết hợp với các khớp xương, sau đó sử dụng
mô hình Markov ẩn (Hidden Markov Model - HMM) [24, 44, 53] để xây
dựng mô hình nhận dạng. J. B. MacQueen [37] đã phân cụm dữ liệu bằng
cách tối thiểu hàm mục tiêu khoảng cách để gắn nhãn cho dữ liệu.
Vì vậy, luận án đề xuất sử dụng đại số hình học bảo giác (Conformal
Geometric Algebra - CGA) [17, 18] để biểu diễn các đối tượng chuyển động trong
không gian. CGA được mở rộng từ không gian thực chiều bằng cách thêm hai3
vectơ cơ sở và sử dụng phép biến đổi để chuyển các vectơ trong không gian thực
thành tập hợp điểm trong không gian CGA. Một vectơ trong không gian CGA được
biểu diễn dưới dạng là một điểm, mặt phẳng, siêu phẳng hoặc siêu cầu. Vì vậy, sử
dụng CGA để biểu diễn các đối tượng chuyển động trong không gian có dữ liệu phân
bố phức tạp dạng siêu phẳng hoặc siêu cầu rất đơn giản và chính xác.
Xuất phát từ nhu cầu thực tiễn trên, tôi chọn đề tài “Nghiên cứu biểu diễn và
nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy”
để làm nội dung nghiên cứu của luận án Tiến sĩ, nhằm góp phần vào việc biểu diễn
đối tượng chuyển động trong không gian và ứng dụng vào lĩnh vực xử lý ảnh, nhận
dạng vật thể chuyển động quay trong không gian và nhận dạng hành động con người
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NĂNG HÙNG VÂN NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NĂNG HÙNG VÂN NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: 1. PGS.TS. Kanta Tachibana 2. TS. Phạm Minh Tuấn Đà Nẵng - 2021 i LỜI CAM ĐOAN Tôi cam đoan các kết quả nghiên cứu được trình bày trong luận án là trung thực và không sao chép từ bất kỳ luận án nào khác. Một số kết quả nghiên cứu là thành quả của tập thể và đã được các đồng tác giả đồng ý cho sử dụng. Mọi trích dẫn đều có ghi nguồn gốc xuất xứ rõ ràng và đầy đủ. Tác giả Nguyễn Năng Hùng Vân ii MỤC LỤC LỜI CAM ĐOAN ................................................................................................... i MỤC LỤC ............................................................................................................. ii DANH MỤC CÁC TỪ VIẾT TẮT ....................................................................... v DANH MỤC KÝ HIỆU TOÁN HỌC .................................................................. vi DANH MỤC HÌNH VẼ ....................................................................................... vii DANH MỤC BẢNG BIỂU .................................................................................... x MỞ ĐẦU ................................................................................................................ 1 1. Mục tiêu nghiên cứu .................................................................................. 3 2. Đối tượng và phạm vi nghiên cứu............................................................. 4 3. Phương pháp nghiên cứu .......................................................................... 5 4. Bố cục của luận án .................................................................................... 5 5. Đóng góp chính của luận án...................................................................... 6 Chương 1. PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN ĐỘNG TRONG HỌC MÁY .............................................................................................. 9 1.1 Phương pháp biểu diễn dữ liệu trong không gian ................................. 9 1.1.1 Phương pháp biểu diễn dữ liệu bằng không gian vectơ ................. 10 1.1.2 Phương pháp biểu diễn dữ liệu bằng ma trận ................................ 10 1.1.3 Phương pháp biểu diễn dữ liệu bằng Ten-xơ ................................ 11 1.2 Phương pháp biểu diễn đối tượng chuyển động trong học máy ......... 12 1.2.1 Biểu diễn dữ liệu dựa trên mô hình xác suất ................................. 13 1.2.2 Phương pháp giảm chiều dữ liệu .................................................. 16 1.2.3 Phương pháp tăng chiều dữ liệu ................................................... 19 1.3 Phương pháp biểu diễn đối tượng chuyển động sử dụng CGA ........... 25 1.3.1 Đại số hình học ............................................................................ 27 iii 1.3.2 Đại số hình học bảo giác .............................................................. 27 1.4 Kết luận chương .................................................................................... 28 Chương 2. ĐỀ XUẤT PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC ..................................... 31 2.1 Đại số hình học hình học bảo giác ........................................................ 31 2.1.1 Đại số hình học ............................................................................ 31 2.1.2 Đại số hình học Bảo giác ............................................................. 37 2.2 Đề xuất phương pháp phân cụm dữ liệu sử dụng CGA ...................... 41 2.2.1 Phân cụm dữ liệu sử dụng CGA dựa trên GMM........................... 43 2.2.2 Lượng tử hóa vectơ dựa trên phân cụm dữ liệu sử dụng CGA ...... 45 2.2.3 Phương pháp kết hợp HMM với phân cụm sử dụng CGA ............ 49 2.3 Đề xuất phương pháp trích chọn đặc trưng sử dụng CGA ................. 50 2.3.1 Phương pháp trích chọn đặc trưng sử dụng PCA .......................... 51 2.3.2 Phương pháp trích chọn đặc trưng sử dụng CGA ......................... 53 2.3.3 Phương pháp PCR kết hợp với CGA ............................................ 55 2.3.4 Phương pháp trích chọn đặc trưng sử dụng CGA kết hợp RNN.... 60 2.4 Kết luận chương .................................................................................... 64 Chương 3. TRIỂN KHAI THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ........ 67 3.1 Dữ liệu thực nghiệm .............................................................................. 68 3.1.1 Đối tượng chuyển động trong không gian .................................... 68 3.1.2 Bộ dữ liệu chuyển động CMU...................................................... 69 3.1.3 Dữ liệu thực nghiệm .................................................................... 71 3.2 Nhận dạng hành động dựa trên phân cụm CGA kết hợp với HMM .. 71 3.2.1 Kết quả thực nghiệm .................................................................... 72 3.2.2 Đánh giá kết quả .......................................................................... 74 iv 3.3 Nhận dạng hành động dựa vào phương pháp PCR kết hợp với CGA 75 3.3.1 Các phương pháp thực nghiệm ..................................................... 76 3.3.2 Kết quả thực nghiệm .................................................................... 76 3.3.3 Đánh giá kết quả .......................................................................... 79 3.4 Nhận dạng hành động dựa vào phương pháp CGA kết hợp với RNN 79 3.4.1 Kết quả thực nghiệm .................................................................... 79 3.4.2 Đánh giá kết quả .......................................................................... 81 3.5 Kết luận chương .................................................................................... 82 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN........................................................... 84 1. Kết quả của luận án ................................................................................ 84 2. Đánh giá kết quả ..................................................................................... 84 3. Hướng nghiên cứu tiếp theo.................................................................... 87 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ..................... 88 TÀI LIỆU THAM KHẢO ................................................................................... 89 v DANH MỤC CÁC TỪ VIẾT TẮT Thuật ngữ Tiếng Anh Tiếng Việt 2D Two Dimension Hai chiều 3D Three Dimension Ba chiều AI Artificial Intelligence Trí tuệ nhân tạo ANN Artificial Neural Network Mạng nơron nhân tạo CGA Conformal Ageometric Algebra Đại số hình học bảo giác CMU Carnegie Mellon University Đại học Carnegie Mellon CNN Convolutional Neural Network Mạng nơron tích chập DL Deep Learning Học sâu DTW Dynamic Time Warping So khớp thời gian động EM Expectation Maximization Thuật toán cực đại hóa kỳ vọng GA Geometric Algebra Đại số hình học GMM Gaussian Mixture Model Mô hình hỗn hợp Gauss HAR Human Activity Recognition Nhận dạnh hành động người HMM Hidden Markov Model Mô hình Markov ẩn KNN k-Nearest Neighbor láng giềng gần nhất LDA Linear Discriminant Analysis Phân tích biệt thức tuyến tính LSTM Long Short Term Memory Mạng nơron nhớ ngắn-dài hạn m-D m-Dimension m chiều PCA Principal Components Analysis Phân tích thành phần chính PCR Principal Component Regression Hồi quy thành phần chính RGB Red Green Blue Hệ màu Đỏ-Lục-Lam RNN Recurrent Neural Network Mạng nơron hồi quy SVM Support Vector Machine Máy vectơ hỗ trợ VQ Vector Quantization Lượng tử hóa vectơ vi DANH MỤC KÝ HIỆU TOÁN HỌC Ký hiệu, từ viết tắt Diễn giải Hàm số Lagrange Ma trận phương sai trong CGA Ma trận phương sai trong PCA Ma trận khoảng cách Hàm mật độ xác suất Gauss Tập dữ liệu huấn luyện Số phân cụm Xác suất chuyển từ trạng thái trong HMM Mật độ xác suất đầu ra trong HMM Tập các điểm trong không gian CGA Vectơ bảo giác trong không gín CGA Các trạng thái trong HMM Vectơ trọng số của phép biến đổi tuyến tính trong PCA Vectơ trung bình trong tập dữ liệu Hàm kích hoạt trong mô hình RNN vii DANH MỤC HÌNH VẼ Hình 1.1: Mô hình huấn luyện dữ liệu trong học máy ................................... 9 Hình 1.2: Mô hình hỗn hợp Gauss của M phân phối thành phần ................. 14 Hình 1.3: Mô hình Markov ẩn 3 trạng thái. ................................................. 15 Hình 1.4: Biểu diễn dữ liệu trong không gian mới của PCA ........................ 17 Hình 1.5: Phương pháp phân tích biệt thức tuyến tính hai lớp ..................... 18 Hình 1.6: Xác định siêu phẳng với lề cực đại của SVM trong 2D ................ 20 Hình 1.7: Minh họa quá trình biểu diễn tăng số chiều dữ liệu bằng phương pháp kernel SVM ........................................................................................ 21 Hình 1.8: Mạng nơron với các nút kết nối với nhau để mô phỏng mạng nơron trong não người ........................................................................................... 22 Hình 1.9: Kiến trúc của mạng nơron tích chập gồm hai thành phần ............. 23 Hình 1.10: Phép tích chập trong mạng nơron tích chập ............................... 24 Hình 1.11: Tầng hợp nhất (max pool) với bộ lộc và bước nhảy (stride) bằng 2 trong mạng nơron tích chập......................................................................... 25 Hình 1.12: Mô hình khớp xương và mật độ phân bố dữ liệu khớp lhumerus 26 Hình 2.1: Biểu diễn 2 vectơ trong không gian Clifford 2D .......................... 32 Hình 2.2: Biểu diễn 3 vectơ trong không gian Clifford 3D .......................... 33 Hình 2.3: Phép ngoại tích trong đại số hình học .......................................... 34 Hình 2.4: Phản xạ một vectơ qua một mặt phẳng trong không gian GA ...... 35 Hình 2.5: Phép quay trong không gian GA .................................................. 36 Hình 2.6: Mô hình nhận dạng hành động dựa trên phương pháp phân cụm sử dụng CGA kết hợp với HMM ..................................................................... 42 Hình 2.7: Dữ liệu của đối tượng phân bố dạng hình cung ............................ 43 Hình 2.8: Phân cụm dữ liệu bằng cách sử dụng đại số hình học bảo giác .... 48 viii Hình 2.9: Mô hình nhận dạng hành động bằng phương pháp lượng tử hóa vectơ dựa trên phân cụm dữ liệu sử dụng CGA và thuật toán k-means ................. 48 Hình 2.10: Mô hình nhận dạng hành động ... I, April 1998. [41] J.-F. Hu, W.-S. Zheng, J. Lai, and J. Zhang, "Jointly learning heteroge neous features for rgb-d activity recognition," in CVPR, 2015. [42] J.I, Alan, Linear Discriminant Analysis, Springer, 2012, pp. 1525.1548. 93 [43] J.-L.Gauvain and C.-H.Lee, "Maximum a Posteriori Estimation for Multivariate Guassian Mixture Observation of Markov Chains," in IEEE Transactions on Speech and Audio Processing, vol. 2, no. 2, pp. 291- 298, Apr 1994. [44] JeffA.Bilmes, "A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixtureand Hidden Markov Models," in ISCI, April, 1998. [45] K. Arthishwari, M. Anand, "Design of LSTM-RNN on a Sensor Based HAR using Android Phones," in International Journal of Recent Technology and Engineering (IJRTE), vol. 8, no. 5, pp. 2277-3878, 2020. [46] K. G. Manosha Chathuramali và Ranga Rodrigo, "Faster Human Activity Recognition with SVM," in The International Conference on Advances in ICT for Emerging Regions, 2012. [47] K.Vinothkumar, M.P.Selvan, "Hierarchical Agglomerative Clustering Algorithm method for distributed generation planning," in International Journal of Electrical Power & Energy Systems, vol. 56, pp. 259-269, 2014. [48] Kapadia, M., Chiang, I., Thomas, T., Badler, N. I., & Kider, J. T., "Efficient Motion Retrieval in Large Motion Databases," in the ACM SIGGRAPH Symposium on Interactive 3D Graphics and Games (I3D '13), 2013. [49] L. Dorst, D. Fontijne, and S. Mann, "An Object-oriented Approach to Geometry Morgan Kaufmann Series in Computer Graphics," in Geometric Algebra for Computer Science, 2007. [50] L. Jun, G. Wang, Li..Y. Duan, "Skeleton-based human action recognition with global context-aware attention LSTM networks," in IEEE Transactions on Image Processing, vol. 27, no. 4, pp. 1586-1599, 2017. [51] Lasitha Piyathilaka and Sarath Kodagoda, "Gaussian Mixture Based HMM for Human Daily Activity Recognition Using 3D Skeleton Features," in Centre for Autonomous Systems (CAS), University of Technology, Sydney, Australia. 94 [52] Laurent Fuchs, Eckhard Hitzer, Vincent Nozick and Akihiro Sugimoto, "Three-dimensional quadrics in extended Conformal Geometric Algebras of higher dimensions from control points, implicit equations and axis alignment," Advances in Applied Clifford Algebras, vol. 57, no. 29, pp. 1-22, 2019. [53] Lawrence R.Rabiner, "A Tatorial on Hidden Markov Models and Selected Applications in Speech Recognition," in Fellow, IEEE, 1989. [54] Li Wei and Shishir K. Shah , "Human Activity Recognition using Deep Neural Network with Contextual Information," in Proceedings of the 12th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISIGRAPP 2017), U.S.A, 2017. [55] Lindsay I Smith, A tutorial on Principal Components Analysis, February 26, 2002. [56] M. Debyeche, J.P Haton, and A. Houacine, "A New Vector Quantization front- end Process for Discrete HMM Speech Recognition System," in International Science Index, vol. 1, no. 6, 2007. [57] M. T. Pham, K. Tachibana, E. M. S. Hitzer, T. Yoshikawa, and T. Furuhashi, "Classification and Clustering of Spatial Patterns with Geometric Algebra," in AGACSE 2008 Leipzig, 2008. [58] M. T. Pham, K. Tachibana, T. Yoshikawa and T. Furuhashi, "A clustering method for geometric data based on approximation using conformal geometric algebra," in 2011 IEEE International Conference on Fuzzy Systems, 2011. [59] M.D. Zaharia, L. Dorst, "Modeling and visualization of 3D polygonal mesh surfaces using geometric algebra," in ELSEVIER (Computers & Graphics), vol. 28, p. 519–526, 2004. [60] M.T. Pham and K. Tachibana, "A Conformal Geometric Algebra Based Clustering Method and Its Applications, Advances in Applied Clifford Algebras," Springer Basel, 2008. 95 [61] M.T. Pham, K. Tachibana, E.M.S. Hitzer, S. Buchholz, T. Yoshikawa and T. Furuhashi, "Feature Extractions with Geometric Algebra for Classication of Objects," in IEEE World Congress on Computational Intelligence , Hongkong, 2008. [62] Mannila, Heikki, "Data mining: machine learning, statistics, and databases. Int'l Conf. Scientific and Statistical Database Management.," in IEEE Computer Society, 1996. [63] Manning, C. D. and H. Schutze, Foundations of Statistical Natural Language Processing, MIT Press, 1999. [64] Mark Richardson, Principal Component Analysis, May 2009. [65] McLachlan G. J. and T. Krishnan, The EM Algorithm and its Extensions, 2nd Edition ed., Wiley series in probability and statistics, March 2008, p. 400. [66] Md. Al Mehedi Hasan, Omar Faruqe, "Face recognition using PCA and SVM," in Anti-counterfeiting, Security, and Identification in Communication, 2009. ASID 2009, September 2009. [67] Md. Zia Uddin, Weria Khaksar and; Jim Torresen, "Activity Recognition Using Deep Recurrent Neural Network on Translation and Scale-Invariant Features," in Activity Recognition Using Deep Recurrent Neural Network on Translation and Scale-Invariant Features, 2018. [68] Michael E. Tipping Christopher M. Bishop, "Probabilistic Principal Component Analysis," in Journal of the Royal Statistical Society. Series B, vol. 61, no. 3, pp. 611-622, 1999. [69] N. Matsui, T. Isokawa, H. Kusamichi, F. Peper, and H. Nishimura, "Quaternion Neural Network wwith geometric operators," in Journal on Intelligent and Fuzzy Systems, vol. 15, no. Numbers 3-4, pp. 149-164, 2004. 96 [70] Nag, R., K. Wong, and F. Fallside, "Script recognition using Hidden Markov Models," in IEEE International Conference on Acoustics, Speech, and Signal Processing, Tokyo, Japan, 1986. [71] Oyelade O. J, Oladipupo O. O, Obagbuwa I. C, "Application of k-Means Clustering algorithm for prediction of Students," in International Journal of Computer Science and Information Security (IJCSIS), Vols. Vol. 7,No. 1, 2010. [72] P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features," in International Journal of Computer Vision, vol. 57, no. 2, p. 137–154, 2004. [73] P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features," in International Journal of Computer Vision, vol. 57, p. 137– 154, 2004. [74] Palwasha Afsar, Paulo Cortez and Henrique Santos, "Automatic Human Action Recognition from Video using Hidden Markov Model," in IEEE 18th International Conference on Computational Science and Engineering, 2015. [75] Q. Huo and C. Chan, "Contextual vector quantization for speech recognition with discrete hidden Markov model," in Pattern recognition, vol. 28, no. 4, p. 513–517, 1995. [76] Qin Jin, Alex Waibel, "Application of LDA to Speaker Recognition," in Sixth International Conference on Spoken Language Processing, Beijing, China, 2000. [77] R. Krishnapuram, O. Nasraoui and H. Frigui, "The fuzzy c spherical hells algorithms: a new approach," in IEEE Trans. on Neural Networks, vol. 3, no. 5, p. 663–671, 1992. [78] R.M. Gray, "Vector Quantization," in IEEE ASSP Magazine, vol. 1, no. 2, pp. 4-29, 1984. [79] Rabiner, L. and B. H. Juang, “Fundamentals of Speech Recognition,” Prentice Hall, 1993. 97 [80] Rogerio E. da Silva, Jan Ondˇrej and Aljosa Smolic, "Using LSTM for Automatic Classification of Human Motion Capture Data," in 14th International Conference on Computer Graphics Theory and Applications, VISIGRAPP 2019, 2019. [81] Roweis, S., EM algorithms for PCA and SPCA. In M. I. Jordan, M. J. Kearns, and S. A. Solla (Eds.), vol. 10, Advances in Neural Information Processing Systems, MIT Press, 1998, p. 626–632. [82] S. Buchholz and N. LeBihan, "Optimal separation of polarized signals by quaternionic Neural Network," in 14th European Signal Processing Conference, OUSIPCO 2006, Florence Italya, Stember 4-8, 2006. [83] S. Hochreiter and J. Schmidhuber, "Long short-term memory," in Neural Computation, vol. 9, no. 8, p. 1735–1780, 1997. [84] S. J. Sangwine, E. Hitzer, "Polar Decomposition of Complexified Quaternions and Octonions," Advances in Applied Clifford Algebras volume, vol. 23, no. 30, p. 12, 2020. [85] S. Ji, W. Xu, M. Yang, and K. Yu, "3D Convolutional Neural Networks for human action recognition," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 35, no. 1, p. 221–231, 2013. [86] Saman Cooray and Noel O’Connor, "Facial Feature Extraction and Principal Component Analysis for Face Detection in Color Image," in ICIAR 2004 - Springer-Verlag Berlin Heidelberg, vol. 3212, pp. 741-749, 2004. [87] Satonkar Suhas S., Kurhe Ajay B., Dr.Prakash Khanale B., "Face Recognition Using Principal Component Analysis and Linear Discriminant Analysis on Holistic Approach in Facial Images Database," in IOSR Journal of Engineering, vol. 2, no. 12, pp. 15-23, Dec. 2012. [88] Shizhen Zhao, Wenfeng Li and Jingjing Cao, "A User-Adaptive Algorithm for Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and Multivariate Gaussian Distribution," in Sensors 2018. 98 [89] Shizhen Zhao, Wenfeng Li, Jingjing Cao, "A User-Adaptive Algorithm for Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and Multivariate Gaussian Distribution," in Sensors, vol. 18, no. 1850, 2018. [90] Steinwart, Ingo, Christmann, Andreas, Support Vector Machines, Springer, 2008. [91] Swarndeep Saket J, Dr. Sharnil Pandya, "An Overview of Partitioning Algorithms in Clustering Techniques," in International Journal of Advanced Research in Computer Engineering & Technology, vol. 5, no. 6, pp. 1943 - 1946, June 2016. [92] T. M. a. Y. B. R. Pascanu, "On the difficulty of training Recurrent Neural Networks," in International Conference on Machine Learning, 2013, 2013. [93] T. Nitta, "An Extension of the Back – Propagation Algorithm to Complex Numbers, Neural Network," ELSEVIER (Neural Networks), vol. 10, no. 25, p. 1391 – 1415, November 1997. [94] Tong, L., Song, Q., Ge, Y., Liu, M, "HMM based Human fall detection and prediction method using tri-axial accelerometer," in IEEE Sens, vol. 13, p. 1849–1856, 2013. [95] The Carnegie Mellon University, "The Carnegie Mellon University Motion Capture Database," [96] Wee-Hong Ong, Takafumi Koseki, Leon Palafox, "An Unsupervised Approach for Human Activity Detection and Recognition," International Journal of Simulation Systems, Science & Technology, vol. 14, no. 5, pp. 42-49, 2013. [97] Y. Du, W. Wang, and L. Wang, "Hierarchical Recurrent Neural Network for Skeleton based Action Recognition," in IEEE Conference on Computer Vision and Pattern Recognition, 2015. [98] Ye, J., H. Yao, and F. Jiang, "Based on HMM and SVM multilayer architecture classifier for Chinese sign language recognition with large vocabulary," in Multi-Agent Security and Survivability, 2004 IEEE First Symposium, 2004.
File đính kèm:
- luan_an_nghien_cuu_bieu_dien_va_nhan_dang_doi_tuong_chuyen_d.pdf
- 02_NG_NANG_HUNG_VAN_TomTat_LuanAn_Viet.pdf
- 03_NG_NANG_HUNG_VAN_TomTat_LuanAn_Eng.pdf
- 04_NG_NANG_HUNG_VAN_Trich_yeu_Luanan.pdf
- 05_NG_NANG_HUNG_VAN_DongGopMoi_Luanan.pdf