Rumah  >  Artikel  >  Java  >  Cara menulis aplikasi rangkaian sosial berasaskan sistem cadangan menggunakan Java

Cara menulis aplikasi rangkaian sosial berasaskan sistem cadangan menggunakan Java

WBOY
WBOYasal
2023-06-27 08:32:141139semak imbas

Dalam aplikasi rangkaian sosial moden, sistem pengesyoran telah menjadi fungsi penting. Sama ada mengesyorkan rakan kepada pengguna, mengesyorkan topik yang diminati, mengesyorkan produk berkaitan atau mengesyorkan kandungan yang lebih berharga, sistem pengesyoran boleh meningkatkan pengalaman pengguna dan kelekatan dengan berkesan.

Dalam artikel ini, kami akan memperkenalkan cara menulis aplikasi rangkaian sosial berdasarkan sistem pengesyoran menggunakan Java. Kami akan menggabungkan kod sebenar dan langkah terperinci untuk membantu pembaca memahami dan melaksanakan sistem pengesyoran asas dengan cepat.

1. Pengumpulan dan pemprosesan data

Sebelum melaksanakan sebarang sistem pengesyoran, kami perlu mengumpul dan memproses sejumlah besar data. Dalam aplikasi rangkaian sosial, maklumat pengguna, siaran, ulasan, suka dan data lain adalah semua sumber data yang berharga.

Untuk memudahkan demonstrasi, kami boleh menggunakan penjana data maya sumber terbuka untuk menjana data ini. Langkah-langkah khusus adalah seperti berikut:

  1. Muat turun dan pasang penjana data maya, seperti Mockaroo (https://www.mockaroo.com/).
  2. Tentukan set data yang perlu dijana, termasuk maklumat pengguna, siaran, ulasan, dsb.
  3. Jana data dan eksport ke fail CSV.
  4. Gunakan kod Java untuk membaca data dalam fail CSV dan menyimpannya dalam pangkalan data. Kita boleh menggunakan pangkalan data hubungan popular seperti MySQL dan Oracle untuk menyimpan data. Di sini, kami menggunakan MySQL 8.0 sebagai pangkalan data untuk penyimpanan data.

2. Perwakilan pengguna dan item

Dalam sistem pengesyoran, kita perlu menukar pengguna dan item ke dalam bentuk vektor atau matriks untuk mengira persamaan atau membuat cadangan. Dalam aplikasi rangkaian sosial, kami boleh menggunakan kaedah berikut untuk mewakili pengguna dan item:

  1. Vektor pengguna: Kami boleh menggunakan data seperti topik yang diikuti pengguna, siaran yang diterbitkan, rakan yang berinteraksi dengan mereka, dsb. untuk mewakili pengguna vektor. Contohnya, jika pengguna A mengikuti topik Java, Python, JavaScript, dll., menyiarkan "Cara belajar Java dengan baik" dan "Bermula dengan Java", dan berinteraksi dengan pengguna B dan C, maka kita boleh menggunakan vektor berikut untuk mewakili pengguna A:

Pengguna A = [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0 , 0, 1]

di mana panjang vektor ialah 24, dan setiap kedudukan mewakili topik atau siaran. 1 bermakna pengguna A telah mengikuti topik atau menerbitkan siaran, dan 0 bermakna tidak.

  1. Vektor item: Kami boleh menggunakan tag, kandungan, ulasan dan data lain setiap siaran untuk mewakili vektor siaran. Sebagai contoh, jika siaran ditandakan "Java, pengaturcaraan" dan kandungannya ialah "Empat cadangan untuk mempelajari pengaturcaraan Java" dan mempunyai 10 ulasan, maka kita boleh menggunakan vektor berikut untuk mewakili siaran:

Siaran A = [1 , 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 10, 0]

di mana , panjang vektor ialah 24, dan setiap kedudukan mewakili label atau data statistik. 1 bermakna siaran mengandungi teg atau kandungan, 0 bermakna tidak.

3. Pengesyoran penapisan kolaboratif berasaskan pengguna

Penapisan kolaboratif berasaskan pengguna ialah kaedah biasa dalam sistem pengesyoran. Ia mengesyorkan item berdasarkan persamaan minat pengguna. Di sini, kami menggunakan penapisan kolaboratif berasaskan pengguna untuk mengesyorkan siaran yang sesuai untuk pengguna. Langkah-langkah khusus adalah seperti berikut:

  1. Kira persamaan antara pengguna. Di sini, kami menggunakan pekali korelasi Pearson sebagai metrik persamaan.
  2. Pilih pengguna K yang minatnya paling serupa dengan pengguna sasaran.
  3. Untuk setiap pengguna, pilih N siaran yang mereka suka tetapi belum dilihat oleh pengguna sasaran.
  4. Untuk N siaran yang dipilih, kira skor pengesyoran setiap siaran dan isikannya dari tinggi ke rendah.
  5. Pilih siaran M teratas dengan markah tertinggi sebagai keputusan yang disyorkan.

Berikut ialah pelaksanaan kod Java bagi algoritma ini:

public class CollaborativeFiltering {

    /**
     * 计算用户间的皮尔逊相关系数
     * @param user1 用户1
     * @param user2 用户2
     * @param data 数据集
     * @return 皮尔逊相关系数
     */
    public double pearsonCorrelation(Map<Integer, Double> user1, Map<Integer, Double> user2,
                                      Map<Integer, Map<Integer, Double>> data) {
        double sum1 = 0, sum2 = 0, sum1Sq = 0, sum2Sq = 0, pSum = 0;
        int n = 0;
        for (int item : user1.keySet()) {
            if (user2.containsKey(item)) {
                sum1 += user1.get(item);
                sum2 += user2.get(item);
                sum1Sq += Math.pow(user1.get(item), 2);
                sum2Sq += Math.pow(user2.get(item), 2);
                pSum += user1.get(item) * user2.get(item);
                n++;
            }
        }
        if (n == 0)
            return 0;
        double num = pSum - (sum1 * sum2 / n);
        double den = Math.sqrt((sum1Sq - Math.pow(sum1, 2) / n) *
                (sum2Sq - Math.pow(sum2, 2) / n));
        if (den == 0)
            return 0;
        return num / den;
    }

    /**
     * 基于用户的协同过滤推荐算法
     * @param data 数据集
     * @param userId 目标用户 ID
     * @param K 最相似的 K 个用户
     * @param N 推荐的 N 个帖子
     * @return 推荐的帖子 ID 列表
     */
    public List<Integer> userBasedCollaborativeFiltering(Map<Integer, Map<Integer, Double>> data,
                                                          int userId, int K, int N) {
        Map<Integer, Double> targetUser = data.get(userId); // 目标用户
        List<Map.Entry<Integer, Double>> similarUsers = new ArrayList<>(); // 与目标用户兴趣相似的用户
        for (Map.Entry<Integer, Map<Integer, Double>> entry: data.entrySet()) {
            int id = entry.getKey();
            if (id == userId)
                continue;
            double sim = pearsonCorrelation(targetUser, entry.getValue(), data); // 计算皮尔逊相关系数
            if (sim > 0)
                similarUsers.add(new AbstractMap.SimpleEntry<>(id, sim));
        }
        Collections.sort(similarUsers, (a, b) -> b.getValue().compareTo(a.getValue())); // 按相似度从高到低排序
        List<Integer> itemIds = new ArrayList<>();
        for (int i = 0; i < K && i < similarUsers.size(); i++) {
            Map.Entry<Integer, Double> entry = similarUsers.get(i);
            int userId2 = entry.getKey();
            Map<Integer, Double> user2 = data.get(userId2);
            for (int itemId: user2.keySet()) {
                if (!targetUser.containsKey(itemId)) { // 如果目标用户没看过该帖子
                    itemIds.add(itemId);
                }
            }
        }
        Map<Integer, Double> scores = new HashMap<>();
        for (int itemId: itemIds) {
            double score = 0;
            int count = 0;
            for (Map.Entry<Integer, Double> entry: similarUsers) {
                int userId2 = entry.getKey();
                Map<Integer, Double> user2 = data.get(userId2);
                if (user2.containsKey(itemId)) { // 如果用户 2 看过该帖子
                    score += entry.getValue() * user2.get(itemId);
                    count++;
                    if (count == N)
                        break;
                }
            }
            scores.put(itemId, score);
        }
        List<Integer> pickedItemIds = new ArrayList<>();
        scores.entrySet().stream().sorted((a, b) -> b.getValue().compareTo(a.getValue()))
                .limit(N).forEach(entry -> pickedItemIds.add(entry.getKey())); // 按得分从高到低排序并选出前N个
        return pickedItemIds;
    }
}

4. Algoritma pengesyoran berasaskan kandungan

Algoritma pengesyoran berasaskan kandungan ialah satu lagi kaedah biasa dalam sistem pengesyoran. Ia mengesyorkan item berdasarkan persamaan atribut item. . Di sini, kami menggunakan algoritma pengesyoran berasaskan kandungan untuk mengesyorkan siaran yang sesuai kepada pengguna. Langkah-langkah khusus adalah seperti berikut:

  1. Untuk pengguna sasaran, pilih topik yang mereka ikuti, siaran dan kandungan lain.
  2. Berdasarkan kandungan ini, kira persamaan setiap siaran dengan minat pengguna sasaran.
  3. Pilih siaran N teratas yang paling serupa dengan minat pengguna sasaran.
  4. Isih mengikut skor dari tinggi ke rendah, dan pilih siaran M teratas dengan markah tertinggi sebagai hasil yang disyorkan.

Berikut ialah pelaksanaan kod Java bagi algoritma pengesyoran berasaskan kandungan:

public class ContentBasedRecommendation {

    /**
     * 计算两个向量的余弦相似度
     * @param v1 向量1
     * @param v2 向量2
     * @return 余弦相似度
     */
    public double cosineSimilarity(double[] v1, double[] v2) {
        double dotProduct = 0;
        double norma = 0;
        double normb = 0;
        for (int i = 0; i < v1.length; i++) {
            dotProduct += v1[i] * v2[i];
            norma += Math.pow(v1[i], 2);
            normb += Math.pow(v2[i], 2);
        }
        if (norma == 0 || normb == 0)
            return 0;
        return dotProduct / (Math.sqrt(norma) * Math.sqrt(normb));
    }

    /**
     * 基于内容的推荐算法
     * @param data 数据集
     * @param userId 目标用户 ID
     * @param N 推荐的 N 个帖子
     * @return 推荐的帖子 ID 列表
     */
    public List<Integer> contentBasedRecommendation(Map<Integer, Map<Integer, Double>> data,
                                                     int userId, int N) {
        Map<Integer, Double> targetUser = data.get(userId); // 目标用户
        int[] pickedItems = new int[data.size()];
        double[][] itemFeatures = new double[pickedItems.length][24]; // 物品特征矩阵
        for (Map.Entry<Integer, Map<Integer, Double>> entry: data.entrySet()) {
            int itemId = entry.getKey();
            Map<Integer, Double> item = entry.getValue();
            double[] feature = new double[24];
            for (int i = 0; i < feature.length; i++) {
                if (item.containsKey(i+1)) {
                    feature[i] = item.get(i+1);
                } else {
                    feature[i] = 0;
                }
            }
            itemFeatures[itemId-1] = feature; // 物品 ID 从 1 开始,需要减一
        }
        for (int itemId: targetUser.keySet()) {
            pickedItems[itemId-1] = 1; // 物品 ID 从 1 开始,需要减一
        }
        double[] similarities = new double[pickedItems.length];
        for (int i = 0; i < similarities.length; i++) {
            if (pickedItems[i] == 0) {
                similarities[i] = cosineSimilarity(targetUser.values().stream().mapToDouble(Double::doubleValue).toArray(), itemFeatures[i]);
            }
        }
        List<Integer> itemIds = new ArrayList<>();
        while (itemIds.size() < N) {
            int maxIndex = -1;
            for (int i = 0; i < similarities.length; i++) {
                if (pickedItems[i] == 0 && (maxIndex == -1 || similarities[i] > similarities[maxIndex])) {
                    maxIndex = i;
                }
            }
            if (maxIndex == -1 || similarities[maxIndex] < 0) {
                break; // 找不到更多相似的物品了
            }
            itemIds.add(maxIndex + 1); // 物品 ID 从 1 开始,需要加一
            pickedItems[maxIndex] = 1;
        }
        Map<Integer, Double> scores = new HashMap<>();
        for (int itemId: itemIds) {
            double[] features = itemFeatures[itemId-1]; // 物品 ID 从 1 开始,需要减一
            double score = cosineSimilarity(targetUser.values().stream().mapToDouble(Double::doubleValue).toArray(), features);
            scores.put(itemId, score);
        }
        List<Integer> pickedItemIds = new ArrayList<>();
        scores.entrySet().stream().sorted((a, b) -> b.getValue().compareTo(a.getValue()))
                .limit(N).forEach(entry -> pickedItemIds.add(entry.getKey())); // 按得分从高到低排序并选出前N个
        return pickedItemIds;
    }
}

5. Integrasikan algoritma pengesyoran ke dalam aplikasi

Selepas melengkapkan pelaksanaan dua algoritma pengesyoran di atas, kami boleh menyepadukannya ke dalam aplikasi . Langkah-langkah khusus adalah seperti berikut:

  1. Muat data dan simpan dalam pangkalan data. Kita boleh menggunakan rangka kerja ORM seperti Hibernate untuk memudahkan operasi mengakses pangkalan data.
  2. Tentukan API RESTful yang menerima permintaan HTTP dan mengembalikan respons dalam format JSON. Kami boleh menggunakan Rangka Kerja Spring untuk membina dan menggunakan API RESTful.
  3. Laksanakan pengesyoran penapisan kolaboratif berasaskan pengguna dan algoritma pengesyoran berasaskan kandungan dan integrasikannya ke dalam API RESTful.

Berikut ialah pelaksanaan kod Java aplikasi:

@RestController
@RequestMapping("/recommendation")
public class RecommendationController {

    private CollaborativeFiltering collaborativeFiltering = new CollaborativeFiltering();
    private ContentBasedRecommendation contentBasedRecommendation = new ContentBasedRecommendation();

    @Autowired
    private UserService userService;

    @GetMapping("/userbased/{userId}")
    public List<Integer> userBasedRecommendation(@PathVariable Integer userId) {
        List<User> allUsers = userService.getAllUsers();
        Map<Integer, Map<Integer, Double>> data = new HashMap<>();
        for (User user: allUsers) {
            Map<Integer, Double> userVector = new HashMap<>();
            List<Topic> followedTopics = user.getFollowedTopics();
            for (Topic topic: followedTopics) {
                userVector.put(topic.getId(), 1.0);
            }
            List<Post> posts = user.getPosts();
            for (Post post: posts) {
                userVector.put(post.getId() + 1000, 1.0);
            }
            List<Comment> comments = user.getComments();
            for (Comment comment: comments) {
                userVector.put(comment.getId() + 2000, 1.0);
            }
            List<Like> likes = user.getLikes();
            for (Like like: likes) {
                userVector.put(like.getId() + 3000, 1.0);
            }
            data.put(user.getId(), userVector);
        }
        List<Integer> itemIds = collaborativeFiltering.userBasedCollaborativeFiltering(data, userId, 5, 10);
        return itemIds;
    }

    @GetMapping("/contentbased/{userId}")
    public List<Integer> contentBasedRecommendation(@PathVariable Integer userId) {
        List<User> allUsers = userService.getAllUsers();
        Map<Integer, Map<Integer, Double>> data = new HashMap<>();
        for (User user: allUsers) {
            Map<Integer, Double> userVector = new HashMap<>();
            List<Topic> followedTopics = user.getFollowedTopics();
            for (Topic topic: followedTopics) {
                userVector.put(topic.getId(), 1.0);
            }
            List<Post> posts = user.getPosts();
            for (Post post: posts) {
                userVector.put(post.getId() + 1000, 1.0);
            }
            List<Comment> comments = user.getComments();
            for (Comment comment: comments) {
                userVector.put(comment.getId() + 2000, 1.0);
            }
            List<Like> likes = user.getLikes();
            for (Like like: likes) {
                userVector.put(like.getId() + 3000, 1.0);
            }

Atas ialah kandungan terperinci Cara menulis aplikasi rangkaian sosial berasaskan sistem cadangan menggunakan Java. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn