Chuyển đến nội dung chính

Bài đăng

Đang hiển thị bài đăng từ Tháng 7, 2024

[Book Note] Trắc nghiệm ước mơ - John C. Maxwell

 1. Khi tài năng của một người không phù hợp với những ước mơ của họ và họ không nhận ra điều đó, thì họ sẽ mãi mãi cố gắng làm việc nhưng sẽ chẳng bao giờ biết đến thành công.  2. Bạn có đang tập trung vào những việc mà bạn thích làm hay không? Bạn có đang phát triển thế mạnh của bạn hay không? Cái gì sẽ dễ đến với tôi nhưng khó đến với người khác? 3. Thành công không phải là một sự kiện, nó là một lối sống. 4. Người thành công luôn luôn đưa thời gian, nghị lực và các nguồn lực của họ và trong những thế mạnh, bởi vì họ nhận được sự đền đáp cao nhất từ đó. 5. Chúng ta thường là cái gì mà chúng ta thường làm lặp đi lặp lại. Sự hoàn hảo sau đó không phải là một hành động, mà là một thói quen. 6. Có thể thất bại chỉ vì không biết truyền đạt tầm nhìn cho người khác. 7. Mọi người làm việc vì lý do riêng của họ không phải vì lý do của tôi hay của bạn. 8. Nếu bạn muốn chinh phục ai đó theo giấc mơ của mình, hãy nói bằng thứ "Ngôn ngữ lợi ích" của họ, chứ không phải của chính bạn. ...

[AI] Text Data Analysis methologys

Text Data Analysis methologys 1. Tokenization Process of dividing text into a set of meaningful pieces. There are three methods of the nltk.tokenize: Sentence-tokenized, Word_tokenize and WordPunctTokenizer. 2. Stemming Word can appear in various forms, reduce these different forms into a common base form. Three stemmer: PorterStemmer, LancasterStemmer, and SnowballStemmer. The LANCASTER is the strictest.  3. Lemmatization:  Reduce words to their base forms but more structured approach. 4. Chunking Divide the input text into pieces with no constraints, chunks do not need to be meaningful at all.  5. Bag-of-words model Dealing with text documents that consist of millions of words, converting them into numerical representations which usable for machine learning algorithms. Models each document by building a histogram of all of the words. Counts the number of occurrences of each word in the document use scikit-learn, represent documents by ignoring the word order.  ...