Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy

Học máy là một lĩnh vực của Trí tuệ nhân tạo liên quan đến việc phát triển các

kỹ thuật cho phép máy tính có thể thực hiện được các bài toán phức tạp. Cốt lõi của

học máy là phân tích các tập dữ liệu để tìm ra những quy luật và mô hình thích hợp

nhất để vận dụng vào thực tiễn. Những nghiên cứu trong lĩnh vực học máy đang

hướng đến tất cả lĩnh vực khác nhau trong cuộc sống như tin sinh học, y học, thị giác

máy tính [14], xử lý ngôn ngữ tự nhiên [19] và Trí tuệ nhân tạo [54] để cung cấp cho

người dùng các công cụ xử lý thông tin và hỗ trợ ra quyết định [62].

Ngày nay, khoa học và công nghệ phát triển đã tạo ra một khối lượng dữ liệu

lớn từ các hệ thống giao dịch điện tử, hệ thống lưu trữ dữ liệu đa phương tiện và các

ứng dụng của cảm biến trong internet vạn vật (internet of things). Sự phát triển công

nghệ đã thúc đẩy các nhà nghiên cứu chuyển từ thu, nhận dữ liệu ở mức thấp sang

nghiên cứu tích hợp mức cao có khả năng phân tích, nhận dạng và dự báo các vấn đề

có thể xảy ra trong tương lai [20]. Do đó, ngày càng nhiều bài toán thực tế cần được

giải quyết, đặc biệt là nhận dạng đối tượng chuyển động trong không gian để hỗ trợ

cho các hệ thống an ninh, ngôi nhà thông mình, bệnh viện thông minh, v.v. và cung

cấp cho người dùng những công cụ ngày càng hoàn thiện hơn.

Trong mô hình huấn luyện nhận dạng đối tượng chuyển động [45], dữ liệu đầu

vào được biểu diễn dưới dạng không gian vectơ đặc trưng và sử dụng các phương

pháp biểu diễn dữ liệu để trích chọn đặc trưng cho các mô hình học máy [14] phân

loại đối tượng. Hiện nay, có rất nhiều nghiên cứu liên quan đến biểu diễn đối tượng

trong học máy được các nhà khoa học đề xuất và thử nghiệm. Các nghiên cứu đã tập

trung vào phương pháp trích chọn đặc trưng giảm số chiều dữ liệu như phân tích

thành phần chính (Principal Components Analysis - PCA) [36], phân tích biệt thức

tuyến tính (Linear Discriminant Analysis - LDA) [42] và hồi quy thành phần chính

(Principal Component Regression - PCR) [35] và phương pháp tăng chiều dữ liệu

như máy vectơ hỗ trợ (kernel Support Vector Machine - SVM) [11, 90] và mạng2

nơron (Neural Network - NN) [8]. Tuy nhiên, các phương pháp này chủ yếu sử dụng

phương pháp tuyến tính và giả sử dữ liệu phân bố trên mặt phẳng hay siêu mặt phẳng

đặc biệt nào đó mà không phải dạng phân bố ngẫu nhiên trong không gian. Do đó,

quá trình biểu diễn các đối tượng chuyển động dựa vào học máy đã gặp rất nhiều khó

khăn:

- Thứ nhất, việc thu thập dữ liệu đầu vào từ nhiều nguồn, nhiều định dạng

khác nhau rất phức tạp, trong khi đó các phương pháp biểu diễn dữ liệu bị

giới hạn bởi các thuật toán đã có sẳn.

- Thứ hai, các đặc trưng của đối tượng thường rất lớn và không phải đặc

trưng nào cũng tốt cho các mô hình học máy.

- Thứ ba, các thuật toán phổ biến trong học máy thường sử dụng các phép

biến đổi tuyến tính và giả sử các đối tượng đều phân bố trên mặt phẳng hay

siêu phẳng. Điều này dẫn đến những khó khăn nhất định đối với dữ liệu

phân bố trên hình cầu hay siêu cầu, chẳng hạn như các đối tượng chuyển

động quay trong không gian nhiều chiều.

- Thứ tư, các hàm tối ưu trong học máy đa phần sử dụng hàm khoảng cách

Euclid nên không phản ánh được mối liên kết hình học và biểu diễn không

chính xác chuyển động của đối tượng. Ví dụ như, D. Gehrig [15] sử dụng

các phương pháp biệt thức tuyến tính (LDA) và chuyển tiếp tuần tự

(Sequential Forward Selection - SFS) để lựa chọn đặc trưng và giảm chi

phí tính toán. L. Fengjun [26] phân tích và đưa ra bảy loại đặc trưng khác

nhau dựa vào tư thế người và kết hợp với các khớp xương, sau đó sử dụng

mô hình Markov ẩn (Hidden Markov Model - HMM) [24, 44, 53] để xây

dựng mô hình nhận dạng. J. B. MacQueen [37] đã phân cụm dữ liệu bằng

cách tối thiểu hàm mục tiêu khoảng cách để gắn nhãn cho dữ liệu.

Vì vậy, luận án đề xuất sử dụng đại số hình học bảo giác (Conformal

Geometric Algebra - CGA) [17, 18] để biểu diễn các đối tượng chuyển động trong

không gian. CGA được mở rộng từ không gian thực  chiều bằng cách thêm hai3

vectơ cơ sở và sử dụng phép biến đổi để chuyển các vectơ trong không gian thực

thành tập hợp điểm trong không gian CGA. Một vectơ trong không gian CGA được

biểu diễn dưới dạng là một điểm, mặt phẳng, siêu phẳng hoặc siêu cầu. Vì vậy, sử

dụng CGA để biểu diễn các đối tượng chuyển động trong không gian có dữ liệu phân

bố phức tạp dạng siêu phẳng hoặc siêu cầu rất đơn giản và chính xác.

Xuất phát từ nhu cầu thực tiễn trên, tôi chọn đề tài “Nghiên cứu biểu diễn và

nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy”

để làm nội dung nghiên cứu của luận án Tiến sĩ, nhằm góp phần vào việc biểu diễn

đối tượng chuyển động trong không gian và ứng dụng vào lĩnh vực xử lý ảnh, nhận

dạng vật thể chuyển động quay trong không gian và nhận dạng hành động con người

pdf 110 trang chauphong 16/08/2022 12380
Bạn đang xem 20 trang mẫu của tài liệu "Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy

Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC ĐÀ NẴNG 
NGUYỄN NĂNG HÙNG VÂN 
NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG 
ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ 
HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY 
LUẬN ÁN TIẾN SĨ KỸ THUẬT 
Đà Nẵng – 2021 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC ĐÀ NẴNG 
NGUYỄN NĂNG HÙNG VÂN 
NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG 
ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ 
HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY 
 Chuyên ngành : KHOA HỌC MÁY TÍNH 
 Mã số : 62 48 01 01 
LUẬN ÁN TIẾN SĨ KỸ THUẬT 
 Người hướng dẫn khoa học: 
1. PGS.TS. Kanta Tachibana 
2. TS. Phạm Minh Tuấn 
Đà Nẵng - 2021 
i 
LỜI CAM ĐOAN 
Tôi cam đoan các kết quả nghiên cứu được trình bày trong luận án là trung 
thực và không sao chép từ bất kỳ luận án nào khác. Một số kết quả nghiên cứu là 
thành quả của tập thể và đã được các đồng tác giả đồng ý cho sử dụng. Mọi trích dẫn 
đều có ghi nguồn gốc xuất xứ rõ ràng và đầy đủ. 
Tác giả 
 Nguyễn Năng Hùng Vân 
ii 
MỤC LỤC 
LỜI CAM ĐOAN ................................................................................................... i 
MỤC LỤC ............................................................................................................. ii 
DANH MỤC CÁC TỪ VIẾT TẮT ....................................................................... v 
DANH MỤC KÝ HIỆU TOÁN HỌC .................................................................. vi 
DANH MỤC HÌNH VẼ ....................................................................................... vii 
DANH MỤC BẢNG BIỂU .................................................................................... x 
MỞ ĐẦU ................................................................................................................ 1 
1. Mục tiêu nghiên cứu .................................................................................. 3 
2. Đối tượng và phạm vi nghiên cứu............................................................. 4 
3. Phương pháp nghiên cứu .......................................................................... 5 
4. Bố cục của luận án .................................................................................... 5 
5. Đóng góp chính của luận án...................................................................... 6 
Chương 1. PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN ĐỘNG 
TRONG HỌC MÁY .............................................................................................. 9 
1.1 Phương pháp biểu diễn dữ liệu trong không gian ................................. 9 
1.1.1 Phương pháp biểu diễn dữ liệu bằng không gian vectơ ................. 10 
1.1.2 Phương pháp biểu diễn dữ liệu bằng ma trận ................................ 10 
1.1.3 Phương pháp biểu diễn dữ liệu bằng Ten-xơ ................................ 11 
1.2 Phương pháp biểu diễn đối tượng chuyển động trong học máy ......... 12 
1.2.1 Biểu diễn dữ liệu dựa trên mô hình xác suất ................................. 13 
1.2.2 Phương pháp giảm chiều dữ liệu .................................................. 16 
1.2.3 Phương pháp tăng chiều dữ liệu ................................................... 19 
1.3 Phương pháp biểu diễn đối tượng chuyển động sử dụng CGA ........... 25 
1.3.1 Đại số hình học ............................................................................ 27 
iii 
1.3.2 Đại số hình học bảo giác .............................................................. 27 
1.4 Kết luận chương .................................................................................... 28 
Chương 2. ĐỀ XUẤT PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN 
ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC ..................................... 31 
2.1 Đại số hình học hình học bảo giác ........................................................ 31 
2.1.1 Đại số hình học ............................................................................ 31 
2.1.2 Đại số hình học Bảo giác ............................................................. 37 
2.2 Đề xuất phương pháp phân cụm dữ liệu sử dụng CGA ...................... 41 
2.2.1 Phân cụm dữ liệu sử dụng CGA dựa trên GMM........................... 43 
2.2.2 Lượng tử hóa vectơ dựa trên phân cụm dữ liệu sử dụng CGA ...... 45 
2.2.3 Phương pháp kết hợp HMM với phân cụm sử dụng CGA ............ 49 
2.3 Đề xuất phương pháp trích chọn đặc trưng sử dụng CGA ................. 50 
2.3.1 Phương pháp trích chọn đặc trưng sử dụng PCA .......................... 51 
2.3.2 Phương pháp trích chọn đặc trưng sử dụng CGA ......................... 53 
2.3.3 Phương pháp PCR kết hợp với CGA ............................................ 55 
2.3.4 Phương pháp trích chọn đặc trưng sử dụng CGA kết hợp RNN.... 60 
2.4 Kết luận chương .................................................................................... 64 
Chương 3. TRIỂN KHAI THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ........ 67 
3.1 Dữ liệu thực nghiệm .............................................................................. 68 
3.1.1 Đối tượng chuyển động trong không gian .................................... 68 
3.1.2 Bộ dữ liệu chuyển động CMU...................................................... 69 
3.1.3 Dữ liệu thực nghiệm .................................................................... 71 
3.2 Nhận dạng hành động dựa trên phân cụm CGA kết hợp với HMM .. 71 
3.2.1 Kết quả thực nghiệm .................................................................... 72 
3.2.2 Đánh giá kết quả .......................................................................... 74 
iv 
3.3 Nhận dạng hành động dựa vào phương pháp PCR kết hợp với CGA 75 
3.3.1 Các phương pháp thực nghiệm ..................................................... 76 
3.3.2 Kết quả thực nghiệm .................................................................... 76 
3.3.3 Đánh giá kết quả .......................................................................... 79 
3.4 Nhận dạng hành động dựa vào phương pháp CGA kết hợp với RNN 79 
3.4.1 Kết quả thực nghiệm .................................................................... 79 
3.4.2 Đánh giá kết quả .......................................................................... 81 
3.5 Kết luận chương .................................................................................... 82 
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN........................................................... 84 
1. Kết quả của luận án ................................................................................ 84 
2. Đánh giá kết quả ..................................................................................... 84 
3. Hướng nghiên cứu tiếp theo.................................................................... 87 
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ..................... 88 
TÀI LIỆU THAM KHẢO ................................................................................... 89 
v 
DANH MỤC CÁC TỪ VIẾT TẮT 
Thuật ngữ Tiếng Anh Tiếng Việt 
2D Two Dimension Hai chiều 
3D Three Dimension Ba chiều 
AI Artificial Intelligence Trí tuệ nhân tạo 
ANN Artificial Neural Network Mạng nơron nhân tạo 
CGA Conformal Ageometric Algebra Đại số hình học bảo giác 
CMU Carnegie Mellon University Đại học Carnegie Mellon 
CNN Convolutional Neural Network Mạng nơron tích chập 
DL Deep Learning Học sâu 
DTW Dynamic Time Warping So khớp thời gian động 
EM Expectation Maximization Thuật toán cực đại hóa kỳ vọng 
GA Geometric Algebra Đại số hình học 
GMM Gaussian Mixture Model Mô hình hỗn hợp Gauss 
HAR Human Activity Recognition Nhận dạnh hành động người 
HMM Hidden Markov Model Mô hình Markov ẩn 
KNN k-Nearest Neighbor  láng giềng gần nhất 
LDA Linear Discriminant Analysis Phân tích biệt thức tuyến tính 
LSTM Long Short Term Memory Mạng nơron nhớ ngắn-dài hạn 
m-D m-Dimension m chiều 
PCA Principal Components Analysis Phân tích thành phần chính 
PCR Principal Component Regression Hồi quy thành phần chính 
RGB Red Green Blue Hệ màu Đỏ-Lục-Lam 
RNN Recurrent Neural Network Mạng nơron hồi quy 
SVM Support Vector Machine Máy vectơ hỗ trợ 
VQ Vector Quantization Lượng tử hóa vectơ 
vi 
DANH MỤC KÝ HIỆU TOÁN HỌC 
Ký hiệu, từ viết tắt Diễn giải 
 Hàm số Lagrange 
 Ma trận phương sai trong CGA 
 Ma trận phương sai trong PCA 
 Ma trận khoảng cách 
 Hàm mật độ xác suất Gauss 
 Tập dữ liệu huấn luyện 
 Số phân cụm 
 Xác suất chuyển từ trạng thái trong HMM 
 Mật độ xác suất đầu ra trong HMM 
 Tập các điểm trong không gian CGA 
 Vectơ bảo giác trong không gín CGA 
 Các trạng thái trong HMM 
 Vectơ trọng số của phép biến đổi tuyến tính trong PCA 
 Vectơ trung bình trong tập dữ liệu 
 Hàm kích hoạt trong mô hình RNN 
vii 
DANH MỤC HÌNH VẼ 
Hình 1.1: Mô hình huấn luyện dữ liệu trong học máy ................................... 9 
Hình 1.2: Mô hình hỗn hợp Gauss của M phân phối thành phần ................. 14 
Hình 1.3: Mô hình Markov ẩn 3 trạng thái. ................................................. 15 
Hình 1.4: Biểu diễn dữ liệu trong không gian mới của PCA ........................ 17 
Hình 1.5: Phương pháp phân tích biệt thức tuyến tính hai lớp ..................... 18 
Hình 1.6: Xác định siêu phẳng với lề cực đại của SVM trong 2D ................ 20 
Hình 1.7: Minh họa quá trình biểu diễn tăng số chiều dữ liệu bằng phương 
pháp kernel SVM ........................................................................................ 21 
Hình 1.8: Mạng nơron với các nút kết nối với nhau để mô phỏng mạng nơron 
trong não người ........................................................................................... 22 
Hình 1.9: Kiến trúc của mạng nơron tích chập gồm hai thành phần ............. 23 
Hình 1.10: Phép tích chập trong mạng nơron tích chập ............................... 24 
Hình 1.11: Tầng hợp nhất (max pool) với bộ lộc và bước nhảy (stride) bằng 2 
trong mạng nơron tích chập......................................................................... 25 
Hình 1.12: Mô hình khớp xương và mật độ phân bố dữ liệu khớp lhumerus 26 
Hình 2.1: Biểu diễn 2 vectơ trong không gian Clifford 2D .......................... 32 
Hình 2.2: Biểu diễn 3 vectơ trong không gian Clifford 3D .......................... 33 
Hình 2.3: Phép ngoại tích trong đại số hình học .......................................... 34 
Hình 2.4: Phản xạ một vectơ qua một mặt phẳng trong không gian GA ...... 35 
Hình 2.5: Phép quay trong không gian GA .................................................. 36 
Hình 2.6: Mô hình nhận dạng hành động dựa trên phương pháp phân cụm sử 
dụng CGA kết hợp với HMM ..................................................................... 42 
Hình 2.7: Dữ liệu của đối tượng phân bố dạng hình cung ............................ 43 
Hình 2.8: Phân cụm dữ liệu bằng cách sử dụng đại số hình học bảo giác .... 48 
viii 
Hình 2.9: Mô hình nhận dạng hành động bằng phương pháp lượng tử hóa vectơ 
dựa trên phân cụm dữ liệu sử dụng CGA và thuật toán k-means ................. 48 
Hình 2.10: Mô hình nhận dạng hành động  ... I, April 1998. 
[41] J.-F. Hu, W.-S. Zheng, J. Lai, and J. Zhang, "Jointly learning heteroge neous 
features for rgb-d activity recognition," in CVPR, 2015. 
[42] 
J.I, Alan, Linear Discriminant Analysis, Springer, 2012, pp. 1525.1548. 
93 
[43] J.-L.Gauvain and C.-H.Lee, "Maximum a Posteriori Estimation for 
Multivariate Guassian Mixture Observation of Markov Chains," in IEEE 
Transactions on Speech and Audio Processing, vol. 2, no. 2, pp. 291- 298, Apr 
1994. 
[44] JeffA.Bilmes, "A Gentle Tutorial of the EM Algorithm and its Application to 
Parameter Estimation for Gaussian Mixtureand Hidden Markov Models," in 
ISCI, April, 1998. 
[45] K. Arthishwari, M. Anand, "Design of LSTM-RNN on a Sensor Based HAR 
using Android Phones," in International Journal of Recent Technology and 
Engineering (IJRTE), vol. 8, no. 5, pp. 2277-3878, 2020. 
[46] K. G. Manosha Chathuramali và Ranga Rodrigo, "Faster Human Activity 
Recognition with SVM," in The International Conference on Advances in ICT 
for Emerging Regions, 2012. 
[47] K.Vinothkumar, M.P.Selvan, "Hierarchical Agglomerative Clustering 
Algorithm method for distributed generation planning," in International 
Journal of Electrical Power & Energy Systems, vol. 56, pp. 259-269, 2014. 
[48] Kapadia, M., Chiang, I., Thomas, T., Badler, N. I., & Kider, J. T., "Efficient 
Motion Retrieval in Large Motion Databases," in the ACM SIGGRAPH 
Symposium on Interactive 3D Graphics and Games (I3D '13), 2013. 
[49] L. Dorst, D. Fontijne, and S. Mann, "An Object-oriented Approach to 
Geometry Morgan Kaufmann Series in Computer Graphics," in Geometric 
Algebra for Computer Science, 2007. 
[50] L. Jun, G. Wang, Li..Y. Duan, "Skeleton-based human action recognition with 
global context-aware attention LSTM networks," in IEEE Transactions on 
Image Processing, vol. 27, no. 4, pp. 1586-1599, 2017. 
[51] Lasitha Piyathilaka and Sarath Kodagoda, "Gaussian Mixture Based HMM for 
Human Daily Activity Recognition Using 3D Skeleton Features," in Centre for 
Autonomous Systems (CAS), University of Technology, Sydney, Australia. 
94 
[52] Laurent Fuchs, Eckhard Hitzer, Vincent Nozick and Akihiro Sugimoto, 
"Three-dimensional quadrics in extended Conformal Geometric Algebras of 
higher dimensions from control points, implicit equations and axis alignment," 
Advances in Applied Clifford Algebras, vol. 57, no. 29, pp. 1-22, 2019. 
[53] Lawrence R.Rabiner, "A Tatorial on Hidden Markov Models and Selected 
Applications in Speech Recognition," in Fellow, IEEE, 1989. 
[54] Li Wei and Shishir K. Shah , "Human Activity Recognition using Deep Neural 
Network with Contextual Information," in Proceedings of the 12th 
International Joint Conference on Computer Vision, Imaging and Computer 
Graphics Theory and Applications (VISIGRAPP 2017), U.S.A, 2017. 
[55] Lindsay I Smith, A tutorial on Principal Components Analysis, February 26, 
2002. 
[56] M. Debyeche, J.P Haton, and A. Houacine, "A New Vector Quantization front-
end Process for Discrete HMM Speech Recognition System," in International 
Science Index, vol. 1, no. 6, 2007. 
[57] M. T. Pham, K. Tachibana, E. M. S. Hitzer, T. Yoshikawa, and T. Furuhashi, 
"Classification and Clustering of Spatial Patterns with Geometric Algebra," in 
AGACSE 2008 Leipzig, 2008. 
[58] M. T. Pham, K. Tachibana, T. Yoshikawa and T. Furuhashi, "A clustering 
method for geometric data based on approximation using conformal geometric 
algebra," in 2011 IEEE International Conference on Fuzzy Systems, 2011. 
[59] M.D. Zaharia, L. Dorst, "Modeling and visualization of 3D polygonal mesh 
surfaces using geometric algebra," in ELSEVIER (Computers & Graphics), vol. 
28, p. 519–526, 2004. 
[60] M.T. Pham and K. Tachibana, "A Conformal Geometric Algebra Based 
Clustering Method and Its Applications, Advances in Applied Clifford 
Algebras," Springer Basel, 2008. 
95 
[61] M.T. Pham, K. Tachibana, E.M.S. Hitzer, S. Buchholz, T. Yoshikawa and T. 
Furuhashi, "Feature Extractions with Geometric Algebra for Classication of 
Objects," in IEEE World Congress on Computational Intelligence , Hongkong, 
2008. 
[62] Mannila, Heikki, "Data mining: machine learning, statistics, and databases. 
Int'l Conf. Scientific and Statistical Database Management.," in IEEE 
Computer Society, 1996. 
[63] Manning, C. D. and H. Schutze, Foundations of Statistical Natural Language 
Processing, MIT Press, 1999. 
[64] 
Mark Richardson, Principal Component Analysis, May 2009. 
[65] McLachlan G. J. and T. Krishnan, The EM Algorithm and its Extensions, 2nd 
Edition ed., Wiley series in probability and statistics, March 2008, p. 400. 
[66] Md. Al Mehedi Hasan, Omar Faruqe, "Face recognition using PCA and SVM," 
in Anti-counterfeiting, Security, and Identification in Communication, 2009. 
ASID 2009, September 2009. 
[67] Md. Zia Uddin, Weria Khaksar and; Jim Torresen, "Activity Recognition 
Using Deep Recurrent Neural Network on Translation and Scale-Invariant 
Features," in Activity Recognition Using Deep Recurrent Neural Network on 
Translation and Scale-Invariant Features, 2018. 
[68] Michael E. Tipping Christopher M. Bishop, "Probabilistic Principal 
Component Analysis," in Journal of the Royal Statistical Society. Series B, vol. 
61, no. 3, pp. 611-622, 1999. 
[69] N. Matsui, T. Isokawa, H. Kusamichi, F. Peper, and H. Nishimura, "Quaternion 
Neural Network wwith geometric operators," in Journal on Intelligent and 
Fuzzy Systems, vol. 15, no. Numbers 3-4, pp. 149-164, 2004. 
96 
[70] Nag, R., K. Wong, and F. Fallside, "Script recognition using Hidden Markov 
Models," in IEEE International Conference on Acoustics, Speech, and Signal 
Processing, Tokyo, Japan, 1986. 
[71] Oyelade O. J, Oladipupo O. O, Obagbuwa I. C, "Application of k-Means 
Clustering algorithm for prediction of Students," in International Journal of 
Computer Science and Information Security (IJCSIS), Vols. Vol. 7,No. 1, 2010. 
[72] P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of 
Simple Features," in International Journal of Computer Vision, vol. 57, no. 2, 
p. 137–154, 2004. 
[73] P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of 
Simple Features," in International Journal of Computer Vision, vol. 57, p. 137–
154, 2004. 
[74] Palwasha Afsar, Paulo Cortez and Henrique Santos, "Automatic Human Action 
Recognition from Video using Hidden Markov Model," in IEEE 18th 
International Conference on Computational Science and Engineering, 2015. 
[75] Q. Huo and C. Chan, "Contextual vector quantization for speech recognition 
with discrete hidden Markov model," in Pattern recognition, vol. 28, no. 4, p. 
513–517, 1995. 
[76] Qin Jin, Alex Waibel, "Application of LDA to Speaker Recognition," in Sixth 
International Conference on Spoken Language Processing, Beijing, China, 
2000. 
[77] R. Krishnapuram, O. Nasraoui and H. Frigui, "The fuzzy c spherical hells 
algorithms: a new approach," in IEEE Trans. on Neural Networks, vol. 3, no. 
5, p. 663–671, 1992. 
[78] R.M. Gray, "Vector Quantization," in IEEE ASSP Magazine, vol. 1, no. 2, pp. 
4-29, 1984. 
[79] Rabiner, L. and B. H. Juang, “Fundamentals of Speech Recognition,” Prentice 
Hall, 1993. 
97 
[80] Rogerio E. da Silva, Jan Ondˇrej and Aljosa Smolic, "Using LSTM for 
Automatic Classification of Human Motion Capture Data," in 14th 
International Conference on Computer Graphics Theory and Applications, 
VISIGRAPP 2019, 2019. 
[81] Roweis, S., EM algorithms for PCA and SPCA. In M. I. Jordan, M. J. Kearns, 
and S. A. Solla (Eds.), vol. 10, Advances in Neural Information Processing 
Systems, MIT Press, 1998, p. 626–632. 
[82] S. Buchholz and N. LeBihan, "Optimal separation of polarized signals by 
quaternionic Neural Network," in 14th European Signal Processing 
Conference, OUSIPCO 2006, Florence Italya, Stember 4-8, 2006. 
[83] S. Hochreiter and J. Schmidhuber, "Long short-term memory," in Neural 
Computation, vol. 9, no. 8, p. 1735–1780, 1997. 
[84] S. J. Sangwine, E. Hitzer, "Polar Decomposition of Complexified Quaternions 
and Octonions," Advances in Applied Clifford Algebras volume, vol. 23, no. 
30, p. 12, 2020. 
[85] S. Ji, W. Xu, M. Yang, and K. Yu, "3D Convolutional Neural Networks for 
human action recognition," in IEEE Transactions on Pattern Analysis and 
Machine Intelligence, vol. 35, no. 1, p. 221–231, 2013. 
[86] Saman Cooray and Noel O’Connor, "Facial Feature Extraction and Principal 
Component Analysis for Face Detection in Color Image," in ICIAR 2004 - 
Springer-Verlag Berlin Heidelberg, vol. 3212, pp. 741-749, 2004. 
[87] Satonkar Suhas S., Kurhe Ajay B., Dr.Prakash Khanale B., "Face Recognition 
Using Principal Component Analysis and Linear Discriminant Analysis on 
Holistic Approach in Facial Images Database," in IOSR Journal of 
Engineering, vol. 2, no. 12, pp. 15-23, Dec. 2012. 
[88] Shizhen Zhao, Wenfeng Li and Jingjing Cao, "A User-Adaptive Algorithm for 
Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and 
Multivariate Gaussian Distribution," in Sensors 2018. 
98 
[89] Shizhen Zhao, Wenfeng Li, Jingjing Cao, "A User-Adaptive Algorithm for 
Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and 
Multivariate Gaussian Distribution," in Sensors, vol. 18, no. 1850, 2018. 
[90] Steinwart, Ingo, Christmann, Andreas, Support Vector Machines, Springer, 
2008. 
[91] Swarndeep Saket J, Dr. Sharnil Pandya, "An Overview of Partitioning 
Algorithms in Clustering Techniques," in International Journal of Advanced 
Research in Computer Engineering & Technology, vol. 5, no. 6, pp. 1943 - 
1946, June 2016. 
[92] T. M. a. Y. B. R. Pascanu, "On the difficulty of training Recurrent Neural 
Networks," in International Conference on Machine Learning, 2013, 2013. 
[93] T. Nitta, "An Extension of the Back – Propagation Algorithm to Complex 
Numbers, Neural Network," ELSEVIER (Neural Networks), vol. 10, no. 25, p. 
1391 – 1415, November 1997. 
[94] Tong, L., Song, Q., Ge, Y., Liu, M, "HMM based Human fall detection and 
prediction method using tri-axial accelerometer," in IEEE Sens, vol. 13, p. 
1849–1856, 2013. 
[95] The Carnegie Mellon University, "The Carnegie Mellon University Motion 
Capture Database,"  
[96] Wee-Hong Ong, Takafumi Koseki, Leon Palafox, "An Unsupervised Approach 
for Human Activity Detection and Recognition," International Journal of 
Simulation Systems, Science & Technology, vol. 14, no. 5, pp. 42-49, 2013. 
[97] Y. Du, W. Wang, and L. Wang, "Hierarchical Recurrent Neural Network for 
Skeleton based Action Recognition," in IEEE Conference on Computer Vision 
and Pattern Recognition, 2015. 
[98] Ye, J., H. Yao, and F. Jiang, "Based on HMM and SVM multilayer architecture 
classifier for Chinese sign language recognition with large vocabulary," in 
Multi-Agent Security and Survivability, 2004 IEEE First Symposium, 2004. 

File đính kèm:

  • pdfluan_an_nghien_cuu_bieu_dien_va_nhan_dang_doi_tuong_chuyen_d.pdf
  • pdf02_NG_NANG_HUNG_VAN_TomTat_LuanAn_Viet.pdf
  • pdf03_NG_NANG_HUNG_VAN_TomTat_LuanAn_Eng.pdf
  • pdf04_NG_NANG_HUNG_VAN_Trich_yeu_Luanan.pdf
  • pdf05_NG_NANG_HUNG_VAN_DongGopMoi_Luanan.pdf