Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy

Học máy là một lĩnh vực của Trí tuệ nhân tạo liên quan đến việc phát triển các

kỹ thuật cho phép máy tính có thể thực hiện được các bài toán phức tạp. Cốt lõi của

học máy là phân tích các tập dữ liệu để tìm ra những quy luật và mô hình thích hợp

nhất để vận dụng vào thực tiễn. Những nghiên cứu trong lĩnh vực học máy đang

hướng đến tất cả lĩnh vực khác nhau trong cuộc sống như tin sinh học, y học, thị giác

máy tính [14], xử lý ngôn ngữ tự nhiên [19] và Trí tuệ nhân tạo [54] để cung cấp cho

người dùng các công cụ xử lý thông tin và hỗ trợ ra quyết định [62].

Ngày nay, khoa học và công nghệ phát triển đã tạo ra một khối lượng dữ liệu

lớn từ các hệ thống giao dịch điện tử, hệ thống lưu trữ dữ liệu đa phương tiện và các

ứng dụng của cảm biến trong internet vạn vật (internet of things). Sự phát triển công

nghệ đã thúc đẩy các nhà nghiên cứu chuyển từ thu, nhận dữ liệu ở mức thấp sang

nghiên cứu tích hợp mức cao có khả năng phân tích, nhận dạng và dự báo các vấn đề

có thể xảy ra trong tương lai [20]. Do đó, ngày càng nhiều bài toán thực tế cần được

giải quyết, đặc biệt là nhận dạng đối tượng chuyển động trong không gian để hỗ trợ

cho các hệ thống an ninh, ngôi nhà thông mình, bệnh viện thông minh, v.v. và cung

cấp cho người dùng những công cụ ngày càng hoàn thiện hơn.

Trong mô hình huấn luyện nhận dạng đối tượng chuyển động [45], dữ liệu đầu

vào được biểu diễn dưới dạng không gian vectơ đặc trưng và sử dụng các phương

pháp biểu diễn dữ liệu để trích chọn đặc trưng cho các mô hình học máy [14] phân

loại đối tượng. Hiện nay, có rất nhiều nghiên cứu liên quan đến biểu diễn đối tượng

trong học máy được các nhà khoa học đề xuất và thử nghiệm. Các nghiên cứu đã tập

trung vào phương pháp trích chọn đặc trưng giảm số chiều dữ liệu như phân tích

thành phần chính (Principal Components Analysis - PCA) [36], phân tích biệt thức

tuyến tính (Linear Discriminant Analysis - LDA) [42] và hồi quy thành phần chính

(Principal Component Regression - PCR) [35] và phương pháp tăng chiều dữ liệu

như máy vectơ hỗ trợ (kernel Support Vector Machine - SVM) [11, 90] và mạng2

nơron (Neural Network - NN) [8]. Tuy nhiên, các phương pháp này chủ yếu sử dụng

phương pháp tuyến tính và giả sử dữ liệu phân bố trên mặt phẳng hay siêu mặt phẳng

đặc biệt nào đó mà không phải dạng phân bố ngẫu nhiên trong không gian. Do đó,

quá trình biểu diễn các đối tượng chuyển động dựa vào học máy đã gặp rất nhiều khó

khăn:

- Thứ nhất, việc thu thập dữ liệu đầu vào từ nhiều nguồn, nhiều định dạng

khác nhau rất phức tạp, trong khi đó các phương pháp biểu diễn dữ liệu bị

giới hạn bởi các thuật toán đã có sẳn.

- Thứ hai, các đặc trưng của đối tượng thường rất lớn và không phải đặc

trưng nào cũng tốt cho các mô hình học máy.

- Thứ ba, các thuật toán phổ biến trong học máy thường sử dụng các phép

biến đổi tuyến tính và giả sử các đối tượng đều phân bố trên mặt phẳng hay

siêu phẳng. Điều này dẫn đến những khó khăn nhất định đối với dữ liệu

phân bố trên hình cầu hay siêu cầu, chẳng hạn như các đối tượng chuyển

động quay trong không gian nhiều chiều.

- Thứ tư, các hàm tối ưu trong học máy đa phần sử dụng hàm khoảng cách

Euclid nên không phản ánh được mối liên kết hình học và biểu diễn không

chính xác chuyển động của đối tượng. Ví dụ như, D. Gehrig [15] sử dụng

các phương pháp biệt thức tuyến tính (LDA) và chuyển tiếp tuần tự

(Sequential Forward Selection - SFS) để lựa chọn đặc trưng và giảm chi

phí tính toán. L. Fengjun [26] phân tích và đưa ra bảy loại đặc trưng khác

nhau dựa vào tư thế người và kết hợp với các khớp xương, sau đó sử dụng

mô hình Markov ẩn (Hidden Markov Model - HMM) [24, 44, 53] để xây

dựng mô hình nhận dạng. J. B. MacQueen [37] đã phân cụm dữ liệu bằng

cách tối thiểu hàm mục tiêu khoảng cách để gắn nhãn cho dữ liệu.

Vì vậy, luận án đề xuất sử dụng đại số hình học bảo giác (Conformal

Geometric Algebra - CGA) [17, 18] để biểu diễn các đối tượng chuyển động trong

không gian. CGA được mở rộng từ không gian thực chiều bằng cách thêm hai3

vectơ cơ sở và sử dụng phép biến đổi để chuyển các vectơ trong không gian thực

thành tập hợp điểm trong không gian CGA. Một vectơ trong không gian CGA được

biểu diễn dưới dạng là một điểm, mặt phẳng, siêu phẳng hoặc siêu cầu. Vì vậy, sử

dụng CGA để biểu diễn các đối tượng chuyển động trong không gian có dữ liệu phân

bố phức tạp dạng siêu phẳng hoặc siêu cầu rất đơn giản và chính xác.

Xuất phát từ nhu cầu thực tiễn trên, tôi chọn đề tài “Nghiên cứu biểu diễn và

nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy”

để làm nội dung nghiên cứu của luận án Tiến sĩ, nhằm góp phần vào việc biểu diễn

đối tượng chuyển động trong không gian và ứng dụng vào lĩnh vực xử lý ảnh, nhận

dạng vật thể chuyển động quay trong không gian và nhận dạng hành động con người

110 trang chauphong 16880

Download

Bạn đang xem 20 trang mẫu của tài liệu "Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN NĂNG HÙNG VÂN
NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG
ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ
HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Đà Nẵng – 2021
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN NĂNG HÙNG VÂN
NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG
ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ
HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY
Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số : 62 48 01 01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người hướng dẫn khoa học:
1. PGS.TS. Kanta Tachibana
2. TS. Phạm Minh Tuấn
Đà Nẵng - 2021
i
LỜI CAM ĐOAN
Tôi cam đoan các kết quả nghiên cứu được trình bày trong luận án là trung
thực và không sao chép từ bất kỳ luận án nào khác. Một số kết quả nghiên cứu là
thành quả của tập thể và đã được các đồng tác giả đồng ý cho sử dụng. Mọi trích dẫn
đều có ghi nguồn gốc xuất xứ rõ ràng và đầy đủ.
Tác giả
Nguyễn Năng Hùng Vân
ii
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................... i
MỤC LỤC ............................................................................................................. ii
DANH MỤC CÁC TỪ VIẾT TẮT ....................................................................... v
DANH MỤC KÝ HIỆU TOÁN HỌC .................................................................. vi
DANH MỤC HÌNH VẼ ....................................................................................... vii
DANH MỤC BẢNG BIỂU .................................................................................... x
MỞ ĐẦU ................................................................................................................ 1
1. Mục tiêu nghiên cứu .................................................................................. 3
2. Đối tượng và phạm vi nghiên cứu............................................................. 4
3. Phương pháp nghiên cứu .......................................................................... 5
4. Bố cục của luận án .................................................................................... 5
5. Đóng góp chính của luận án...................................................................... 6
Chương 1. PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN ĐỘNG
TRONG HỌC MÁY .............................................................................................. 9
1.1 Phương pháp biểu diễn dữ liệu trong không gian ................................. 9
1.1.1 Phương pháp biểu diễn dữ liệu bằng không gian vectơ ................. 10
1.1.2 Phương pháp biểu diễn dữ liệu bằng ma trận ................................ 10
1.1.3 Phương pháp biểu diễn dữ liệu bằng Ten-xơ ................................ 11
1.2 Phương pháp biểu diễn đối tượng chuyển động trong học máy ......... 12
1.2.1 Biểu diễn dữ liệu dựa trên mô hình xác suất ................................. 13
1.2.2 Phương pháp giảm chiều dữ liệu .................................................. 16
1.2.3 Phương pháp tăng chiều dữ liệu ................................................... 19
1.3 Phương pháp biểu diễn đối tượng chuyển động sử dụng CGA ........... 25
1.3.1 Đại số hình học ............................................................................ 27
iii
1.3.2 Đại số hình học bảo giác .............................................................. 27
1.4 Kết luận chương .................................................................................... 28
Chương 2. ĐỀ XUẤT PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN
ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC ..................................... 31
2.1 Đại số hình học hình học bảo giác ........................................................ 31
2.1.1 Đại số hình học ............................................................................ 31
2.1.2 Đại số hình học Bảo giác ............................................................. 37
2.2 Đề xuất phương pháp phân cụm dữ liệu sử dụng CGA ...................... 41
2.2.1 Phân cụm dữ liệu sử dụng CGA dựa trên GMM........................... 43
2.2.2 Lượng tử hóa vectơ dựa trên phân cụm dữ liệu sử dụng CGA ...... 45
2.2.3 Phương pháp kết hợp HMM với phân cụm sử dụng CGA ............ 49
2.3 Đề xuất phương pháp trích chọn đặc trưng sử dụng CGA ................. 50
2.3.1 Phương pháp trích chọn đặc trưng sử dụng PCA .......................... 51
2.3.2 Phương pháp trích chọn đặc trưng sử dụng CGA ......................... 53
2.3.3 Phương pháp PCR kết hợp với CGA ............................................ 55
2.3.4 Phương pháp trích chọn đặc trưng sử dụng CGA kết hợp RNN.... 60
2.4 Kết luận chương .................................................................................... 64
Chương 3. TRIỂN KHAI THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ........ 67
3.1 Dữ liệu thực nghiệm .............................................................................. 68
3.1.1 Đối tượng chuyển động trong không gian .................................... 68
3.1.2 Bộ dữ liệu chuyển động CMU...................................................... 69
3.1.3 Dữ liệu thực nghiệm .................................................................... 71
3.2 Nhận dạng hành động dựa trên phân cụm CGA kết hợp với HMM .. 71
3.2.1 Kết quả thực nghiệm .................................................................... 72
3.2.2 Đánh giá kết quả .......................................................................... 74
iv
3.3 Nhận dạng hành động dựa vào phương pháp PCR kết hợp với CGA 75
3.3.1 Các phương pháp thực nghiệm ..................................................... 76
3.3.2 Kết quả thực nghiệm .................................................................... 76
3.3.3 Đánh giá kết quả .......................................................................... 79
3.4 Nhận dạng hành động dựa vào phương pháp CGA kết hợp với RNN 79
3.4.1 Kết quả thực nghiệm .................................................................... 79
3.4.2 Đánh giá kết quả .......................................................................... 81
3.5 Kết luận chương .................................................................................... 82
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN........................................................... 84
1. Kết quả của luận án ................................................................................ 84
2. Đánh giá kết quả ..................................................................................... 84
3. Hướng nghiên cứu tiếp theo.................................................................... 87
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ..................... 88
TÀI LIỆU THAM KHẢO ................................................................................... 89
v
DANH MỤC CÁC TỪ VIẾT TẮT
Thuật ngữ Tiếng Anh Tiếng Việt
2D Two Dimension Hai chiều
3D Three Dimension Ba chiều
AI Artificial Intelligence Trí tuệ nhân tạo
ANN Artificial Neural Network Mạng nơron nhân tạo
CGA Conformal Ageometric Algebra Đại số hình học bảo giác
CMU Carnegie Mellon University Đại học Carnegie Mellon
CNN Convolutional Neural Network Mạng nơron tích chập
DL Deep Learning Học sâu
DTW Dynamic Time Warping So khớp thời gian động
EM Expectation Maximization Thuật toán cực đại hóa kỳ vọng
GA Geometric Algebra Đại số hình học
GMM Gaussian Mixture Model Mô hình hỗn hợp Gauss
HAR Human Activity Recognition Nhận dạnh hành động người
HMM Hidden Markov Model Mô hình Markov ẩn
KNN k-Nearest Neighbor láng giềng gần nhất
LDA Linear Discriminant Analysis Phân tích biệt thức tuyến tính
LSTM Long Short Term Memory Mạng nơron nhớ ngắn-dài hạn
m-D m-Dimension m chiều
PCA Principal Components Analysis Phân tích thành phần chính
PCR Principal Component Regression Hồi quy thành phần chính
RGB Red Green Blue Hệ màu Đỏ-Lục-Lam
RNN Recurrent Neural Network Mạng nơron hồi quy
SVM Support Vector Machine Máy vectơ hỗ trợ
VQ Vector Quantization Lượng tử hóa vectơ
vi
DANH MỤC KÝ HIỆU TOÁN HỌC
Ký hiệu, từ viết tắt Diễn giải
Hàm số Lagrange
Ma trận phương sai trong CGA
Ma trận phương sai trong PCA
Ma trận khoảng cách
Hàm mật độ xác suất Gauss
Tập dữ liệu huấn luyện
Số phân cụm
Xác suất chuyển từ trạng thái trong HMM
Mật độ xác suất đầu ra trong HMM
Tập các điểm trong không gian CGA
Vectơ bảo giác trong không gín CGA
Các trạng thái trong HMM
Vectơ trọng số của phép biến đổi tuyến tính trong PCA
Vectơ trung bình trong tập dữ liệu
Hàm kích hoạt trong mô hình RNN
vii
DANH MỤC HÌNH VẼ
Hình 1.1: Mô hình huấn luyện dữ liệu trong học máy ................................... 9
Hình 1.2: Mô hình hỗn hợp Gauss của M phân phối thành phần ................. 14
Hình 1.3: Mô hình Markov ẩn 3 trạng thái. ................................................. 15
Hình 1.4: Biểu diễn dữ liệu trong không gian mới của PCA ........................ 17
Hình 1.5: Phương pháp phân tích biệt thức tuyến tính hai lớp ..................... 18
Hình 1.6: Xác định siêu phẳng với lề cực đại của SVM trong 2D ................ 20
Hình 1.7: Minh họa quá trình biểu diễn tăng số chiều dữ liệu bằng phương
pháp kernel SVM ........................................................................................ 21
Hình 1.8: Mạng nơron với các nút kết nối với nhau để mô phỏng mạng nơron
trong não người ........................................................................................... 22
Hình 1.9: Kiến trúc của mạng nơron tích chập gồm hai thành phần ............. 23
Hình 1.10: Phép tích chập trong mạng nơron tích chập ............................... 24
Hình 1.11: Tầng hợp nhất (max pool) với bộ lộc và bước nhảy (stride) bằng 2
trong mạng nơron tích chập......................................................................... 25
Hình 1.12: Mô hình khớp xương và mật độ phân bố dữ liệu khớp lhumerus 26
Hình 2.1: Biểu diễn 2 vectơ trong không gian Clifford 2D .......................... 32
Hình 2.2: Biểu diễn 3 vectơ trong không gian Clifford 3D .......................... 33
Hình 2.3: Phép ngoại tích trong đại số hình học .......................................... 34
Hình 2.4: Phản xạ một vectơ qua một mặt phẳng trong không gian GA ...... 35
Hình 2.5: Phép quay trong không gian GA .................................................. 36
Hình 2.6: Mô hình nhận dạng hành động dựa trên phương pháp phân cụm sử
dụng CGA kết hợp với HMM ..................................................................... 42
Hình 2.7: Dữ liệu của đối tượng phân bố dạng hình cung ............................ 43
Hình 2.8: Phân cụm dữ liệu bằng cách sử dụng đại số hình học bảo giác .... 48
viii
Hình 2.9: Mô hình nhận dạng hành động bằng phương pháp lượng tử hóa vectơ
dựa trên phân cụm dữ liệu sử dụng CGA và thuật toán k-means ................. 48
Hình 2.10: Mô hình nhận dạng hành động ... I, April 1998.
[41] J.-F. Hu, W.-S. Zheng, J. Lai, and J. Zhang, "Jointly learning heteroge neous
features for rgb-d activity recognition," in CVPR, 2015.
[42]
J.I, Alan, Linear Discriminant Analysis, Springer, 2012, pp. 1525.1548.
93
[43] J.-L.Gauvain and C.-H.Lee, "Maximum a Posteriori Estimation for
Multivariate Guassian Mixture Observation of Markov Chains," in IEEE
Transactions on Speech and Audio Processing, vol. 2, no. 2, pp. 291- 298, Apr
1994.
[44] JeffA.Bilmes, "A Gentle Tutorial of the EM Algorithm and its Application to
Parameter Estimation for Gaussian Mixtureand Hidden Markov Models," in
ISCI, April, 1998.
[45] K. Arthishwari, M. Anand, "Design of LSTM-RNN on a Sensor Based HAR
using Android Phones," in International Journal of Recent Technology and
Engineering (IJRTE), vol. 8, no. 5, pp. 2277-3878, 2020.
[46] K. G. Manosha Chathuramali và Ranga Rodrigo, "Faster Human Activity
Recognition with SVM," in The International Conference on Advances in ICT
for Emerging Regions, 2012.
[47] K.Vinothkumar, M.P.Selvan, "Hierarchical Agglomerative Clustering
Algorithm method for distributed generation planning," in International
Journal of Electrical Power & Energy Systems, vol. 56, pp. 259-269, 2014.
[48] Kapadia, M., Chiang, I., Thomas, T., Badler, N. I., & Kider, J. T., "Efficient
Motion Retrieval in Large Motion Databases," in the ACM SIGGRAPH
Symposium on Interactive 3D Graphics and Games (I3D '13), 2013.
[49] L. Dorst, D. Fontijne, and S. Mann, "An Object-oriented Approach to
Geometry Morgan Kaufmann Series in Computer Graphics," in Geometric
Algebra for Computer Science, 2007.
[50] L. Jun, G. Wang, Li..Y. Duan, "Skeleton-based human action recognition with
global context-aware attention LSTM networks," in IEEE Transactions on
Image Processing, vol. 27, no. 4, pp. 1586-1599, 2017.
[51] Lasitha Piyathilaka and Sarath Kodagoda, "Gaussian Mixture Based HMM for
Human Daily Activity Recognition Using 3D Skeleton Features," in Centre for
Autonomous Systems (CAS), University of Technology, Sydney, Australia.
94
[52] Laurent Fuchs, Eckhard Hitzer, Vincent Nozick and Akihiro Sugimoto,
"Three-dimensional quadrics in extended Conformal Geometric Algebras of
higher dimensions from control points, implicit equations and axis alignment,"
Advances in Applied Clifford Algebras, vol. 57, no. 29, pp. 1-22, 2019.
[53] Lawrence R.Rabiner, "A Tatorial on Hidden Markov Models and Selected
Applications in Speech Recognition," in Fellow, IEEE, 1989.
[54] Li Wei and Shishir K. Shah , "Human Activity Recognition using Deep Neural
Network with Contextual Information," in Proceedings of the 12th
International Joint Conference on Computer Vision, Imaging and Computer
Graphics Theory and Applications (VISIGRAPP 2017), U.S.A, 2017.
[55] Lindsay I Smith, A tutorial on Principal Components Analysis, February 26,
2002.
[56] M. Debyeche, J.P Haton, and A. Houacine, "A New Vector Quantization front-
end Process for Discrete HMM Speech Recognition System," in International
Science Index, vol. 1, no. 6, 2007.
[57] M. T. Pham, K. Tachibana, E. M. S. Hitzer, T. Yoshikawa, and T. Furuhashi,
"Classification and Clustering of Spatial Patterns with Geometric Algebra," in
AGACSE 2008 Leipzig, 2008.
[58] M. T. Pham, K. Tachibana, T. Yoshikawa and T. Furuhashi, "A clustering
method for geometric data based on approximation using conformal geometric
algebra," in 2011 IEEE International Conference on Fuzzy Systems, 2011.
[59] M.D. Zaharia, L. Dorst, "Modeling and visualization of 3D polygonal mesh
surfaces using geometric algebra," in ELSEVIER (Computers & Graphics), vol.
28, p. 519–526, 2004.
[60] M.T. Pham and K. Tachibana, "A Conformal Geometric Algebra Based
Clustering Method and Its Applications, Advances in Applied Clifford
Algebras," Springer Basel, 2008.
95
[61] M.T. Pham, K. Tachibana, E.M.S. Hitzer, S. Buchholz, T. Yoshikawa and T.
Furuhashi, "Feature Extractions with Geometric Algebra for Classication of
Objects," in IEEE World Congress on Computational Intelligence , Hongkong,
2008.
[62] Mannila, Heikki, "Data mining: machine learning, statistics, and databases.
Int'l Conf. Scientific and Statistical Database Management.," in IEEE
Computer Society, 1996.
[63] Manning, C. D. and H. Schutze, Foundations of Statistical Natural Language
Processing, MIT Press, 1999.
[64]
Mark Richardson, Principal Component Analysis, May 2009.
[65] McLachlan G. J. and T. Krishnan, The EM Algorithm and its Extensions, 2nd
Edition ed., Wiley series in probability and statistics, March 2008, p. 400.
[66] Md. Al Mehedi Hasan, Omar Faruqe, "Face recognition using PCA and SVM,"
in Anti-counterfeiting, Security, and Identification in Communication, 2009.
ASID 2009, September 2009.
[67] Md. Zia Uddin, Weria Khaksar and; Jim Torresen, "Activity Recognition
Using Deep Recurrent Neural Network on Translation and Scale-Invariant
Features," in Activity Recognition Using Deep Recurrent Neural Network on
Translation and Scale-Invariant Features, 2018.
[68] Michael E. Tipping Christopher M. Bishop, "Probabilistic Principal
Component Analysis," in Journal of the Royal Statistical Society. Series B, vol.
61, no. 3, pp. 611-622, 1999.
[69] N. Matsui, T. Isokawa, H. Kusamichi, F. Peper, and H. Nishimura, "Quaternion
Neural Network wwith geometric operators," in Journal on Intelligent and
Fuzzy Systems, vol. 15, no. Numbers 3-4, pp. 149-164, 2004.
96
[70] Nag, R., K. Wong, and F. Fallside, "Script recognition using Hidden Markov
Models," in IEEE International Conference on Acoustics, Speech, and Signal
Processing, Tokyo, Japan, 1986.
[71] Oyelade O. J, Oladipupo O. O, Obagbuwa I. C, "Application of k-Means
Clustering algorithm for prediction of Students," in International Journal of
Computer Science and Information Security (IJCSIS), Vols. Vol. 7,No. 1, 2010.
[72] P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of
Simple Features," in International Journal of Computer Vision, vol. 57, no. 2,
p. 137–154, 2004.
[73] P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of
Simple Features," in International Journal of Computer Vision, vol. 57, p. 137–
154, 2004.
[74] Palwasha Afsar, Paulo Cortez and Henrique Santos, "Automatic Human Action
Recognition from Video using Hidden Markov Model," in IEEE 18th
International Conference on Computational Science and Engineering, 2015.
[75] Q. Huo and C. Chan, "Contextual vector quantization for speech recognition
with discrete hidden Markov model," in Pattern recognition, vol. 28, no. 4, p.
513–517, 1995.
[76] Qin Jin, Alex Waibel, "Application of LDA to Speaker Recognition," in Sixth
International Conference on Spoken Language Processing, Beijing, China,
2000.
[77] R. Krishnapuram, O. Nasraoui and H. Frigui, "The fuzzy c spherical hells
algorithms: a new approach," in IEEE Trans. on Neural Networks, vol. 3, no.
5, p. 663–671, 1992.
[78] R.M. Gray, "Vector Quantization," in IEEE ASSP Magazine, vol. 1, no. 2, pp.
4-29, 1984.
[79] Rabiner, L. and B. H. Juang, “Fundamentals of Speech Recognition,” Prentice
Hall, 1993.
97
[80] Rogerio E. da Silva, Jan Ondˇrej and Aljosa Smolic, "Using LSTM for
Automatic Classification of Human Motion Capture Data," in 14th
International Conference on Computer Graphics Theory and Applications,
VISIGRAPP 2019, 2019.
[81] Roweis, S., EM algorithms for PCA and SPCA. In M. I. Jordan, M. J. Kearns,
and S. A. Solla (Eds.), vol. 10, Advances in Neural Information Processing
Systems, MIT Press, 1998, p. 626–632.
[82] S. Buchholz and N. LeBihan, "Optimal separation of polarized signals by
quaternionic Neural Network," in 14th European Signal Processing
Conference, OUSIPCO 2006, Florence Italya, Stember 4-8, 2006.
[83] S. Hochreiter and J. Schmidhuber, "Long short-term memory," in Neural
Computation, vol. 9, no. 8, p. 1735–1780, 1997.
[84] S. J. Sangwine, E. Hitzer, "Polar Decomposition of Complexified Quaternions
and Octonions," Advances in Applied Clifford Algebras volume, vol. 23, no.
30, p. 12, 2020.
[85] S. Ji, W. Xu, M. Yang, and K. Yu, "3D Convolutional Neural Networks for
human action recognition," in IEEE Transactions on Pattern Analysis and
Machine Intelligence, vol. 35, no. 1, p. 221–231, 2013.
[86] Saman Cooray and Noel O’Connor, "Facial Feature Extraction and Principal
Component Analysis for Face Detection in Color Image," in ICIAR 2004 -
Springer-Verlag Berlin Heidelberg, vol. 3212, pp. 741-749, 2004.
[87] Satonkar Suhas S., Kurhe Ajay B., Dr.Prakash Khanale B., "Face Recognition
Using Principal Component Analysis and Linear Discriminant Analysis on
Holistic Approach in Facial Images Database," in IOSR Journal of
Engineering, vol. 2, no. 12, pp. 15-23, Dec. 2012.
[88] Shizhen Zhao, Wenfeng Li and Jingjing Cao, "A User-Adaptive Algorithm for
Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and
Multivariate Gaussian Distribution," in Sensors 2018.
98
[89] Shizhen Zhao, Wenfeng Li, Jingjing Cao, "A User-Adaptive Algorithm for
Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and
Multivariate Gaussian Distribution," in Sensors, vol. 18, no. 1850, 2018.
[90] Steinwart, Ingo, Christmann, Andreas, Support Vector Machines, Springer,
2008.
[91] Swarndeep Saket J, Dr. Sharnil Pandya, "An Overview of Partitioning
Algorithms in Clustering Techniques," in International Journal of Advanced
Research in Computer Engineering & Technology, vol. 5, no. 6, pp. 1943 -
1946, June 2016.
[92] T. M. a. Y. B. R. Pascanu, "On the difﬁculty of training Recurrent Neural
Networks," in International Conference on Machine Learning, 2013, 2013.
[93] T. Nitta, "An Extension of the Back – Propagation Algorithm to Complex
Numbers, Neural Network," ELSEVIER (Neural Networks), vol. 10, no. 25, p.
1391 – 1415, November 1997.
[94] Tong, L., Song, Q., Ge, Y., Liu, M, "HMM based Human fall detection and
prediction method using tri-axial accelerometer," in IEEE Sens, vol. 13, p.
1849–1856, 2013.
[95] The Carnegie Mellon University, "The Carnegie Mellon University Motion
Capture Database,"
[96] Wee-Hong Ong, Takafumi Koseki, Leon Palafox, "An Unsupervised Approach
for Human Activity Detection and Recognition," International Journal of
Simulation Systems, Science & Technology, vol. 14, no. 5, pp. 42-49, 2013.
[97] Y. Du, W. Wang, and L. Wang, "Hierarchical Recurrent Neural Network for
Skeleton based Action Recognition," in IEEE Conference on Computer Vision
and Pattern Recognition, 2015.
[98] Ye, J., H. Yao, and F. Jiang, "Based on HMM and SVM multilayer architecture
classifier for Chinese sign language recognition with large vocabulary," in
Multi-Agent Security and Survivability, 2004 IEEE First Symposium, 2004.

File đính kèm:

luan_an_nghien_cuu_bieu_dien_va_nhan_dang_doi_tuong_chuyen_d.pdf
02_NG_NANG_HUNG_VAN_TomTat_LuanAn_Viet.pdf
03_NG_NANG_HUNG_VAN_TomTat_LuanAn_Eng.pdf
04_NG_NANG_HUNG_VAN_Trich_yeu_Luanan.pdf
05_NG_NANG_HUNG_VAN_DongGopMoi_Luanan.pdf